《Diktyo: Network-Aware Scheduling in Container-Based Clouds》,具有复杂拓扑约束的请求调度
【集群】KubeSphere搭建记录——ks-installer 解析
针对 Prometheus 安装无效问题的排查过程中,发现难以修改相关配置,因此整理并记录安装器 ks-installer 的相关信息,进而指导组件出故障时的修复
【AI】强化学习入门路径及优质资料
简单总结了学习强化学习的路径以及相关优质资料
【论文】精读笔记1-前沿-跨地域资源预留调度
《Characterizing and orchestrating VM reservation in geo-distributed clouds to improve the resource efficiency》,在地理分布式云中表征和编排 VM 预留
【学术】文献管理与文献阅读经验总结
本文总结了所搜集到的文献管理与文献阅读经验。先分析了目标,再列举了相关工具。
【论文】略读笔记27-前沿-跨地域资源预留调度
《Characterizing and orchestrating VM reservation in geo-distributed clouds to improve the resource efficiency》,在地理分布式云中表征和编排 VM 预留
【论文】略读笔记26-经典-深度强化学习在大规模MEC网络中在线资源调度
《Stacked Autoencoder-Based Deep Reinforcement Learning for Online Resource Scheduling in Large-Scale MEC Networks》,基于堆叠自编码器的深度强化学习在大规模MEC网络中在线资源调度
【论文】略读笔记25-前沿-基于多智能体图强化学习的大规模机器学习集群调度
《Large-Scale Machine Learning Cluster Scheduling via Multi-Agent Graph Reinforcement Learning》,基于多智能体图强化学习的大规模机器学习集群调度
【论文】略读笔记24-经典-大规模智算集群任务调度
《Job scheduling for large-scale machine learning clusters》,大规模智算集群任务调度