介绍为什么需要在 Kubernetes 上引入批处理调度系统 Volcano,分析高性能计算、大数据、AI 等场景下的调度需求与挑战。
【论文】精读笔记5-前沿-字节跳动统一调度架构Gödel-C-研究方案梳理
《Gödel: Unified Large-Scale Resource Management and Scheduling at ByteDance》,哥德尔:字节跳动的统一大规模资源管理和调度
【集群】K8S集群搭建记录——kwok搭建轻量测试环境
本文记录了在服务器上通过 kwok 快速搭建一个轻量级的 k8s 测试环境的详细步骤,适合需要测试大规模集群性能的同学参考。
【集群】K8S集群重启问题排查记录
本文记录了在服务器重启后,k8s 集群无法连接的排查过程,包括权限问题、服务启动问题及解决方案。
【集群】K8S集群搭建记录——kind搭建隔离测试环境
本文记录了在服务器上通过 kind 快速搭建一个独立的 k8s 虚拟集群的详细步骤,适合需要隔离测试环境的同学参考。
【论文】略读笔记84-前沿-大规模模拟器LGDCloudSim
《LGDCloudSim: A Resource Management Simulation System for Large-Scale Geographically Distributed Cloud Data Center Scenarios》,LGDCloudSim:大规模地理分布式云数据中心场景的资源管理模拟系统
【论文】略读笔记83-前沿-Eva考虑干扰的任务共置成本优化
《Eva: Cost-Efficient Cloud-Based Cluster Scheduling》,具有成本效益的基于云的集群调度Eva
【论文】精读笔记4-前沿-字节跳动统一调度架构Gödel-B-相关工作发展脉络梳理
《Gödel: Unified Large-Scale Resource Management and Scheduling at ByteDance》,哥德尔:字节跳动的统一大规模资源管理和调度
【网络】前向纠错FEC技术
本文系统介绍了前向纠错(FEC)技术的原理、分类及其在网络丢包恢复中的应用,涵盖D-FEC与A-FEC两种主要类型,并结合实际场景分析其优缺点。
【论文】精读笔记3-前沿-用RL进行VM重调度以整理碎片-B-相关工作发展脉络梳理
《Towards VM Rescheduling Optimization Through Deep Reinforcement Learning》,通过深度强化学习实现虚拟机重新调度优化