【论文】略读笔记11-前沿-多数据中心迁移

【论文】略读笔记11-前沿-多数据中心迁移

Fre5h1nd Lv5

📖《Carbon Management of Multi-Datacenter Based On Spatio-Temporal Task Migration》

🎯需求

  • 随着地理分布式数据中心(DC)的大规模部署和云服务需求的激增,其高能耗和碳污染问题日益严重。因此,减轻发展中国家碳足迹的有害影响已成为一项重大挑战。
    • 云计算技术的快速发展促进了地理分布式数据中心(geo-distributed dc)的建立和互联,满足了数据处理爆发式增长的需求,提供了无中断服务。
      • 例如,亚马逊在 25 个地理区域部署了大规模数据中心,以支持 80 个可用区,谷歌在美洲、亚洲和欧洲放置了超过 18 个数据园区来扩展其云服务平台。
    • 云计算基础设施的激增增加了巨大的电力负荷,使碳污染变得更加严重。
      • 据估计,到2025年,DC的能源消耗将占全球碳排放量的2.3%,大约相当于航空业的总排放量,到2040年将增加到14%。
    • 电力负荷的持续增长迫使云服务提供商(CSP)探索降低排放水平的方法。风能和光伏(PV)等可再生能源(RES)产生的排放量远低于化石能源,易于获取和自动再生。因此,CSP正在将RES引入DC的供电系统,以缓解能源紧张。
      • 谷歌在美洲、欧洲和亚洲签署了 30 多个绿色电力项目,并从 5GW 以上的风能和光伏电站采购能源;位于犹他州鹰山的Facebook DC将由容量为122 MW的光伏发电厂供电。
  • 然而,可再生能源支持云的挑战正在逐渐浮出水面:RES的时变输出是高度间歇性和波动性的,而由于请求的随机到来,工作量也相当随机,表现出供需的双重不确定性,这与可靠性要求(例如,正常运行时间Tier IV)一起限制了DC的绿色发展,并不可避免地依赖传统的化石能源。

🚧现状

  • 云服务需求激增带来的巨大能源消耗和碳污染激发了许多学者的动力:
    • 1)通过灵活的负荷调节策略提高能源使用效率。
      • 初步探索了直流电内部的部分负荷,并利用其可控性进行电源管理。动态电压/频率缩放(DVFS)技术已经过充分研究,通过根据用户请求密度调整服务器的工作电压和频率来避免服务器中不必要的电源。
      • 冷却中的节能是通过应用机器学习算法来解决的,例如,谷歌使用DeepMind节省了40%的冷却成本。相关工作提出了制冷、IT 负载和电能存储的需求响应协作,以调制 DC 的实时功耗。
    • 2)通过提出多种能源供应整合的方法,最大限度地提高RES的利用率。
      • 将DC作为一个整体控制目标:Dou等人将碳税视为目标函数的一部分,该函数在延迟容忍工作负载的成本和性能之间进行权衡。
      • 丁等人考虑了能源价格、电网和发电机的波动风险,承诺通过建立风险和排放之间的权衡,获得电力采购、储能运营和工作量分配的规划方案。
      • 然而,上述工作都没有考虑全球化DC集群的协同互动。

🛩创新

  • 这些挑战促使我们从两个角度分析配送中心的实际运营场景。
    • 一方面,通过分析RES的输出特性,我们发现不同位置的风电和光伏发电(PV)同时表现出特定的互补特性。
    • 另一方面,在空间上,地理分布式 DC 之间的互连允许在不同的地理位置处理用户请求。暂时,容延迟任务的功率需求可以通过延迟或在服务级别协议(SLA)权限内激活来调整,即工作负载在时间和空间维度上都是灵活的。
    • 因此,有机会通过需求响应来超越当前的最佳实践,将运营稳定性和可持续性结合起来:我们建议根据 DC 间工作负载重新分配和 DC 内部工作负载调度,将负载与 RES 可用性实时匹配。
  • 本文迈出了分析全球多区域可再生能源(RES)互补特征的第一步。有机会灵活安排工作量并跟踪RES以减少排放。
    • 整合数据中心和DC间网络,形成精细化的排放模型,权衡调度减排效果和工作量迁移的碳成本,提出时空任务迁移机制,在二维上追求低碳:本文将密集工作负载以粗粒度转移到RES充足的位置,并调整工作负载的执行时间以响应实时RES波动。因此,排放超额以互补的方式被RES转移和抵消;同时,RES的接受度得到提高。
  • 本文的贡献如下:
    • 讨论了全球分散RES的互补特性。据我们所知,这是首次尝试利用时空互补来减轻单站点RES间歇性对DC的负面影响,为碳管理的可行性奠定了基础。
    • 提出了两个维度上的时空任务迁移机制。与专注于单个DC的现有研究不同,我们通过将地理分布式DC视为一个整体来应对RES的不确定性。整合多数据中心和直流间光网络,形成任务调度减排效应与迁移碳成本平衡的新型发射模型,提出时空任务迁移机制,追求空间域和时域调度的最佳实践。
    • 利用解耦方法高效求解用于碳排放优化的大规模混合整数规划。针对协同发射优化,采用Benders分解算法对任务迁移决策和光路由方案进行解耦,实现全局最优解。

📊效果

  • 利用真实数据进行的实验表明,该方法能够与RES最佳协调需求,减轻地理分布DC的碳污染,并在各种参数场景下验证其性能和适用性。

🧠疑问

  1. 使用的是中心式还是去中心式管理架构?
    • 中心式,在全局管理时不要求实时性,每 1min 做一次决策。而在局部要求实时性,每 4s 做一次决策。

🗺参考文献

[1] T. Yang, H. Jiang, Y. Hou and Y. Geng, “Carbon Management of Multi-Datacenter Based On Spatio-Temporal Task Migration,” in IEEE Transactions on Cloud Computing, vol. 11, no. 1, pp. 1078-1090, 1 Jan.-March 2023, doi: 10.1109/TCC.2021.3130644.

  • 标题: 【论文】略读笔记11-前沿-多数据中心迁移
  • 作者: Fre5h1nd
  • 创建于 : 2023-06-11 14:32:01
  • 更新于 : 2024-03-08 15:35:11
  • 链接: https://freshwlnd.github.io/2023/06/11/literature/literatureNotes11/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论