Potal是HPC的应用系统平台,帮助HPC用户构建计算硬件系统之上的应用即服务模式的平台系统。
不仅如此,Portal通过数据中心数值化技术,将系统内的运营运维数据持久化到数据库中,并基于此构建了HPC系统的运营管理和运维管理能力,借助精细化设计的计量与计费子系统企业将获得前所未有的智能化运营运维体验。
Portal意指为最终客户提供 完善的HPC使用和管理系统,帮助企业级用户建设高性能计算服务平台,以便让最终用户将主要经历集中在科研工作上,降低使用者的学习成本,提升组织的整体规范性、专业性以及生产效率。
Portal从总体架构上分解为数据处理层、业务逻辑层、接入层的典型三层架构。
合理的基础架构是一个系统的根基,云计算的核心是数据中心的数值化,即命题是:“如何把数据中心的资源实体、业务实体 转变成可度量、规整的数据稳固的存储起来以便分析优化”;所以一个云计算的根基内容就是如何规整获取、存储这些数据。
数据处理层应用了自主研发的云数据处理引擎:它采用了插件式的采集组件、流式的数据处理模块、和满足不同场景要求的实时关系型数据库、时序型数据库、大规模并发访问的分布式数据库,以及数据的冷热区分处理策略,保证了数据中心海量数据高效而正确的存储。
由于架构分层的合理性,Portal具有很好的分布式扩容部署、业务逻辑的扩展能力,这不仅是在解决当下企业的问题,也是为未来可能的变化做好了准备。
适用于企业拥有自建的HPC系统,基于系统本身的硬件情况,Portal可以提供全软件栈的部署实施与平台系统建设的平台软件整体解决方案。
应用服务门户(Portal)集成了集群管理软件、操作系统、调度系统、认证系统、存储系统、网络存储系统和DCV系统,便于管理和维护集群资源和调度资源,实现系统化的管理、权限化的分配调度资源、一体化的认证和全景化的监控存储资源的使用情况,为企业提供一站式的业务交互管理体验。
用户也可以使用云的整体解决方案:自动化运维管理系统(Data) 、基础云平台(OS)、应用接入平台(PaaS)、可视化解决方案(View)
适用于集团用户的信息中心或行业服务的计算中心,他们可以将计算服务能力供给到特定的外部单位或企业;例如船舶行业的数值仿真计算中心,可以将其开发的数值仿真计算应用和自建的HPC集群系统通过Portal的方式将计算服务开放出去,这样拥有行业服务能力的应用厂商和计算资源厂商可以在保持自有资产的情况下,将能力以服务方式进行供给,并从中获益(盈利/成本的均摊);类似的还有航空动力、工程仿真等领域都可以以这种解决方案将服务开放给特定的协议上下游企业、兄弟部门。
Portal不仅提供了用户、资源、应用的统一化管理,更以自身独有的计量计费模块和应用集成模块为上下游企业、兄弟部门提供了非常友好的用户体验和运营体验。
而服务提供者可以用自己提供的软硬件一体化服务获得利润,或者在集团公司内进行成本的均摊以及用量利用率、成本分布等运营数据的处理。
Portal不仅适用于大型的企业HPC中心,其灵活的特性组装能力也可以按需对小型教育科研团队提供HPC应用系统的解决方案。
通常情况下,教育领域以及小型的科研团队都不会有太多的计算设备,但麻雀虽小五脏俱全,其小型系统的复杂程度一点也不亚于大型的HPC数据中心。Portal通过灵活的特性组装能力,可以按需进行功能和规模的配置,从而满足小型团队的应用系统解决方案。
基于基础系统的扩展能力,Portal亦可为小型团队提供深度的应用集成,远程可视化环境集成等增值服务。
因为其规模小,因此会对弹性计算能力有着很强烈的需求,小型的试验性计算在本地完成,大型的求解性计算利用Portal连接超算中心的能力,在国家级超算中心完成;客户完全能够按需完成自己的计算求解活动,仅仅为所需付费。
在HPC行业中,根据资源拥有量的多少企业可以分两类,一种是重资产型的企业,他们有海量的节点,几乎所有计算求解都会在自有机房中完成;另一种是轻资产型的企业,他们仅拥有少量的计算资源和存储资源,这些资源只是完成日常的轻量级计算求解任务;当遇到大型计算任务时本地集群是不够用的,这时企业要么消耗时间等待计算结果,要么就会去寻找超算中心这种国家级计算资源。
随着企业自有计算资源的成本越来越高,维护成本越来越高,按需、分时的资源共享模式(即云的模式)越来越受到企业的追捧,云的模式也是一种趋势;但这种趋势对于某些企业来说并不是一定的,因为有些企业的性质决定了他必然是重资产型的。
在这样一个时代背景下,Portal提供了混合云的解决方案,帮助企业在重资产与轻资产的决策中提供权衡的办法;满足企业的业务需求下,让企业可以对资产的拥有程度和持有成本进行灵活的调节。Portal混合云解决方案可以满足如下场景:
1、 企业期望能够保持轻资产的拥有模式,但仍需要解决突发性的资源需求
2、 企业期望能够逐步向轻资产模式进行过度,但不期望业务受到太大的影响
3、 企业本身就是轻资产的模式,他们需要一种简单的办法使用超算中心资源
Portal的混合云模式帮助维持用户日常的业务模式,同时对接超算中心,在资源突发情况出现时,企业的业务模式保持不变,企业可以按需付费;当企业期望向轻资产模式转型时,Portal提供了一种平滑的过渡方案:不管是企业自身的本地资源,还是超算中心,对于用户来说它仅仅是在Portal中选择一个计算资源的选项而已,因此从开始转型到转型结束用户通过Portal的使用方式没有任何变化。
对于一些科研创新团队、实验室来说持有自有资源可能是一件非常奢侈的事情,因此使用超算中心资源是他们的首选,然而超算中心的接入、使用、软件的应用部署安装等等工序对这些科学家来说完全是不同的知识领域。Portal可以完全帮助这些客户将他们自有的业务、研究项目、数值试验环境建设在超算中心上,通过Portal简洁的交互方式,让用户完全聚焦在自己的业务试验上,并按照资源的使用情况,按需付费。
Portal可以部署在科研团队的内部服务器上或互联网的公有服务器上,并连接到超算中心实现这一目标。
近年来国家在大力发展计算、数值模拟软件的国产化,对于这些高精尖领域的软件而言他们大多是需要科学家、科研院士等级别的人提供的核心算法,而这些核心算法变成商业化产品过程中还需要很多商业化软件的优化、人机交互系统的优化、安装部署方面的优化等。
Portal + 计算软件套件 = 商业化计算软件套件
Portal可以提供完整的解决方案体系、人机交互系统、监控运维系统、安装部署方案,在软件厂商使用自有的计算软件与Portal进行深度OEM合作后,可以迅速的提供非常出色的商业化软件版本,商业化程度完全可以达到即买即用。
例如,国家航空试验机构开发出风洞的数字模拟环境软件,以及其他的软件分析套件,然后通过Portal的OEM,打包成数值风洞软件套装;而后某航空设计公司在了解到软件的性能参数后购买了数值风洞软件套装,在设计使用的集群环境中,一键式完成了套件的安装和部署,打开数值风洞的软件界面,他们看见的是一个个图形化的交互界面,而背后却是整个Portal系统在帮助客户使用整个集群资源,并通过实时采集和远程可视化技术,把软件的计算结果反馈给用户,使用起来就像Windows桌面系统一样简单。