駕馭京東云的全球最大規模Docker集群、最大規模Kubernetes集群,如同要讓大象學會跳舞,以龐大身軀跳出輕盈優雅的舞步。
容器編排、負載均衡、集群擴縮容......當資源調度的各項內容被冠以“超大規模集群”后,簡單的調度分配資源算法已經無法滿足復雜的調度需求,阿基米德調度系統應運而生。
01撬動數據中心的支點
在行業首個混合云操作系統云艦中,阿基米德作為核心調度系統,是資源交付的基石,負責整個京東數據中心的資源調度,是撬動整個數據中心的支點。
舉例最直觀的的感知:京東的電商場景中,購物車、訂單、詳情等,涉及到的每一臺容器分布,包括容器編排、單機計算資源、內存資源,均由阿基米德分配和調度,特別是618、11.11的超大流量場景下,少數容器編排錯誤都有可能給業務帶來致命影響,調度器需負責把控峰值時每一臺容器計算的質量,其重要性可想而知。
經歷京東體系復雜場景的多年磨練,阿基米德可實現最優的集群全局調度、最優的一次作業調度,不僅能確保全局資源編排和成本最優、資源運行最穩定,還能在集群內選擇最合適的宿主機,以最佳的資源使用、最少的相互干擾(如 CPU 分布、IO 爭搶),來運行提交的計算作業。
2025-04-29 22:24
2025-04-29 22:23
2025-04-29 22:22
2025-04-29 22:22
2025-04-29 22:21
2025-04-29 22:20
2025-04-29 22:19
2025-04-29 22:18
2025-04-29 22:17
2025-04-29 22:16