【论文】略读笔记47-经典-局部性波动感知的高度动态工作负载预测

【论文】略读笔记47-经典-局部性波动感知的高度动态工作负载预测

Fre5h1nd Lv5

📖《FAST: A forecasting model with adaptive sliding window and time locality integration for dynamic cloud workloads》

2022 年发表于 CCF-A 类期刊 TSC。

🎯需求

  • 工作负载预测器作为主动服务运营管理框架的关键组成部分而受到关注。但是,云应用程序的请求和资源工作负载是高度动态的。
    • 越来越多的应用和服务部署到云平台,如谷歌云、亚马逊AWS、阿里云等。为此,服务提供商和管理者需要确保以尽可能低的成本满足与用户签署的服务级别协议 (SLA) 要求。
    • 然而,由于云环境的高度动态性,云服务经常表现出资源配置不足和过度配置,从而导致违反 SLA 和成本效率低下。因此,提出了主动服务运营管理技术,通过工作负载预测方法提前做出运行时决策和分配,确保服务质量(QoS)和成本效益。
    • MAPE 循环是一种用于服务运营管理的四步方法,包括监控、分析、计划和执行。
      • 监控是收集云应用的历史请求工作负载(例如,请求到达和调用)、资源工作负载(例如,CPU、内存、磁盘和网络)和 QoS 指标(例如,响应时间和吞吐量);
      • 分析是预测未来的工作负载,实时分析是否满足SLA;
      • 计划是做出适当的业务运营管理决策,避免QoS下降和成本低效;
      • 最后,执行是使用部署、伸缩、调度和迁移等技术实现相应的运行时操作。
    • 因此,作为 MAPE 循环中的关键步骤,工作负载预测对于确保可靠的应用程序性能和合理的资源使用至关重要。

🚧现状

  • 然而,现有的云应用工作负载准确预测方法仍存在诸多不足。
  • 现有方法将原始工作负载分解为趋势、季节性和随机部分,相应地建立模型,然后组合所有输出以生成结果。事实上,随机分量通常具有显著的异方差性和噪声,对模型精度的提高几乎没有影响,甚至有负面影响。
    • 1)高易失性的云工作负载:以时间序列形式存储的工作负载数据通常具有高度易失性,因此仅基于原始工作负载系列很难保证模型的准确性。
    • 2)模型观察窗口的大小:滑动窗口的大小直接影响模型的精度。大多数现有方法使用固定大小窗口,无法适应高度动态的工作负载。
    • 局部预测因子的整合策略:大多数现有方法通常采用加权平均或简单的基于误差的策略,而不关注局部预测因子随时间的变化行为差异。因此,集成模型的优势没有得到最大化。
  • 值得注意的是,具有时间序列分解的工作负载预测技术侧重于高度波动的云工作负载,流行的分解技术包括 STL、小波变换和EMD,它们通常将原始工作负载序列分解为多个组件,例如趋势、季节性和随机组件。并基于各分量分别建立预测模型,进一步组合联合预测模型。
  • 然而,相关工作表明,随机分量具有显著的异方差性和噪声,对模型精度的提高影响最小,甚至为负。

🛩创新

  • 以高动态的云工作负载(如请求和资源工作负载)为研究对象,提出了一种新型的集成工作负载预测模型FAST,具有自适应滑动窗口和时间局部性集成组件。
    • 在我们的模型中,趋势和季节性成分被视为宏观工作负载变化,微观工作负载变化是通过自适应滑动窗口算法获得的。该算法考虑了趋势相关性、时间相关性和工作负载的随机波动,用于在线回归,以实现更高的精度和更低的开销;
    • 对于基于误差的整合策略,提出了局部预测行为的时间局部性概念,并开发了一种用于模型集成的多类回归算法。
  • 具体贡献如下:
    • a. 该文提出一种在线集成工作负载预测模型(FAST),该模型提出了一种新的综合思路,即学习工作负载的宏观和微观变化,从而解决了基于分解工作负载或原始工作负载的现有集成模型的精度不足问题。
    • b. 该文提出一种自适应滑动窗口方法(ASW),该方法充分考虑了不同工作负载变化与适当窗口大小的关系,包括趋势相关性、时间相关性和随机波动,以更低的时间开销提高了模型精度。
    • c. 针对基于误差的整合策略,该文提出一种考虑局部预测行为时间局部性的多类回归加权算法的时间局部性积分方法(TLI),以提高模型预测的准确性和泛化性。

📊效果

  • 最后,我们对 Google 集群跟踪数据集进行了实验,结果表明 FAST 在动态工作负载方面比所有其他最先进的模型具有更高的准确性。

⛳️未来机会

  • 为了进一步提高FAST在不同预测场景下的自适应能力,值得进一步研究不同多类回归算法适应更集成的预测模型的能力,最终实现多类回归算法的自动选择和构建

🧠疑问

  1. 啥是高度易失性?
  2. 本文发现的核心问题是什么?
    • 随机分量波动性大,但也有一定局部规律。如果不感知这种规律,直接使用随机分量会导致模型学到错误的规则,不使用随机分量会导致存在误差。
    • 通过滑动窗口模式,能够根据随机分量是否存在规律而动态调整被使用的随机分量时间长度。


  • 希望这篇博客对你有帮助!如果你有任何问题或需要进一步的帮助,请随时提问。
  • 如果你喜欢这篇文章,欢迎动动小手 给我一个follow或star。

🗺参考文献

[1] B. Feng, Z. Ding and C. Jiang, “FAST: A Forecasting Model With Adaptive Sliding Window and Time Locality Integration for Dynamic Cloud Workloads,” in IEEE Transactions on Services Computing, vol. 16, no. 2, pp. 1184-1197, 1 March-April 2023, doi: 10.1109/TSC.2022.3156619.

  • 标题: 【论文】略读笔记47-经典-局部性波动感知的高度动态工作负载预测
  • 作者: Fre5h1nd
  • 创建于 : 2024-07-08 14:54:48
  • 更新于 : 2024-07-09 16:46:53
  • 链接: https://freshwlnd.github.io/2024/07/08/literature/literatureNotes47/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论