生态云平台为海量数据存储、计算及不间断数据实时计算等场景应用提供基础设施与服务保障。但随着生态大数据的不断积累,平台数据中心的规模日益增大,服务环境更加复杂。一方面,平台设备异构、虚拟化部署效率低使得资源弹性供应自动化变差,由此导致平台能耗成倍增加;另一方面,复杂的服务环境造成硬件故障、软件失效等错误发生的频率显著增加,增大了平台服务应用中断的风险。因此以建设“高性能、低功耗且具有可靠性保障”目标构建生态云基础设施服务平台,核心技术包括支撑生态服务高效可靠运行的“资源管理机制”和“服务保障机制”两部分。
资源管理机制面向生态大数据分析的大规模、分布式计算需求,即部署在分布式云平台的并发大数据分析应用和面向大规模多用户的大数据分析应用,从能效优化的角度出发建立一套虚拟化数据中心资源池中的物理服务器、虚拟机动态管理和调度的机制,包括能耗和性能感知的动态虚拟资源分配机制、动态负载平衡虚拟机迁移机制等,解决基础设施平台资源超额分配的高能耗问题。
服务保障机制预测云服务软件系统中的云资源消耗情况,提出一种基于ARIMA-LSTM混合模型的云服务资源利用情况实时预测方法,用以判定云服务软件的资源消耗严重程度并以此为重要依据,进行在线迁移等改进软件运行环境质量的操作,防止软件长期运行导致的不可预测的软件故障,有效提升平台的高质量、可持续服务能力。解决基础设施云平台中分布式软件构件长期高负荷运行导致的软件运行性能下降甚至崩溃等难题,提升了云服务软件的可靠性。