高性能计算集群整体管理解决方案 面向系统管理员

与您共同管理系统和支持用户,分担50%+工作量,提升服务质量。7x24小时主动服务,系统管理支持专属微信群,百人专家团队互补,经验丰富,知识库积累深厚,随时助您消除各种疑难杂症。根据需要,提供上门、巡检及驻场服务

面临问题

解决方案

与您共同管理系统和支持用户,分担50%+工作量,提升服务质量。

7x24小时主动服务,系统管理支持专属微信群,百人专家团队互补,经验丰富,知识库积累深厚,随时助您消除各种疑难杂症。

根据需要,提供上门、巡检及驻场服务。

工欲善其事必先利其器

针对高性能计算场景开发的功能全面门户系统,大幅提高工作效率,提升工作业绩。统一门户平台全面覆盖系统监控、作业监控、计费、公告发布、自动运维报告、运营统计分析等常用功能。

门户系统

 

大规模集群系统全面数据实时监控,直观掌握集群整体状态,在参观展示场景中,生动直观展现大规模集群的运行状态,极具表现力。

大规模集群系统实时运营展示界面

 

全面实时监测大规模集群硬件温度状况、关键功能节点状态、文件系统状态、作业调度系统状态、作业运行状态等,发现异常实时推送告警,利用手机应用或微信实时接收告警,为集群可靠运行提供必要的基础保障。

手机微信告警接收端

 

针对多用户使用的大规模集群场景,提供按用户作业维度监控,快速定位指定用户作业异常。

按用户作业维度监控界面

 

实时监测作业在相同硬件、相同应用、相同规模的性能指标,智能对比历史性能数据,实时告警,确保作业高效运行,加速用户成果产出,为用户提供高质量服务。

作业性能智能分析告警界面

 

针对高性能计算场景,专门开发计费系统,可依据资源类型、作业队列等条件灵活计费。

计费管理页面

 

机房停电、设备检修等情况下,常需要向用户发布公告,通过门户选择分组用户,快速群发,微信和邮件相结合实时送达。

消息通知发布页面

 

自动积累资源历史利用率、用户资源使用占比、集群历史故障等运营数据,门户系统自动生成运维分析报告,积累集群运营经验,辅助提升集群管理水平。创新的定制化运营分析报告充分向领导展现卓越工作,同时,量化客观的运营数据分析为决策层购置新设备、调配资源等提供精准的科学决策依据。

运营分析报告内容之一

 

日期:2017年02月03日 11:13

联系并行®