《SpotServe: Serving Generative Large Language Models on Preemptible Instances》,SpotServe: 在可抢占实例上为生成式大型语言模型提供服务
【论文】略读笔记57-前沿-大规模负载预测
《Less: Large-scale Workload Forecasting Model Based on Multiple Sequence Compression》,Less:基于多序列压缩的大规模工作量预测模型
【集群】K8S集群解析——大规模能力
本文首先介绍K8S整体组件架构,其次介绍并总结了来自个人博客、阿里巴巴和字节跳动的大规模下K8S瓶颈,最后细分介绍K8S大规模瓶颈相关组件架构。
【论文】略读笔记56-前沿-量子云计算模拟器
《iQuantum: A toolkit for modeling and simulation of quantum computing environments》,iQuantum:量子计算环境建模与仿真工具包
【论文】略读笔记55-经典-噪声保护数据集的评估平台
《Themis: A Fair Evaluation Platform for Computer Vision Competitions》,THEMIS:计算机视觉竞赛的公平评估平台
【论文】略读笔记54-前沿-硬件辅助AI训练框架
《GUARDIAN: A Hardware-Assisted Distributed Framework to Enhance Deep Learning Security》,GUARDIAN:增强深度学习安全性的硬件辅助分布式框架
【论文】略读笔记53-前沿-实时任务边缘各类设备组网
《RIDIC: Real-Time Intelligent Transportation System With Dispersed Computing》,RIDIC:基于分散计算的实时智能交通系统
【论文】略读笔记52-前沿-多种运行时动态调整
《Adaptive Selecting Algorithm for Runtime Types of Microservices》,微服务运行时类型的自适应选择算法
【论文】略读笔记51-前沿-主动式动态集成服务管理
《Proactive Elastic Scheduling for Serverless Ensemble Inference Services》,无服务器集合推理服务的主动弹性调度
【论文】略读笔记50-前沿-微服务容器群体关系分析及预测
《GROUP: An End-to-end Multi-step-ahead Workload Prediction Approach Focusing on Workload Group Behavior》,GROUP:以工作量群体行为为重点的端到端多步骤超前工作量预测方法