阿里云發布云數據中心專用處理器CIPU,構建新一代云計算架構體系
2022年6月13日,阿里云智能總裁張建鋒在峰會上正式發布CIPU(Cloud infrastructure Processing Units),這是為新型云數據中心設計的專用處理器,未來將替代CPU成為云計算的管控和加速中心。
在這個全新體系架構下,CIPU向下對數據中心的計算、存儲、網絡資源快速云化并進行硬件加速,向上接入飛天云操作系統,將全球數百萬臺服務器連成一臺超級計算機。
例如,CIPU與計算結合,快速接入不同類型資源的服務器,帶來算力的“0”損耗,以及硬件級安全的加固隔離;CIPU與存儲結合,對存算分離架構的塊存儲接入進行硬件加速,云盤存儲IOPS最高可達300萬,長尾時延降低50%;CIPU與網絡結合,可對高帶寬物理網絡進行硬件加速,構建大規模彈性RDMA高性能網絡,時延最低可達5us。
基于CIPU和飛天的新一代云計算架構體系,在通用計算、大數據、人工智能等核心場景的計算測試中展現了優越的性能。在通用分布式計算領域,Redis性能提升了68%、MySQL提升了60%,Nginx提升了30%;高吞吐類的互聯網業務上云之后,比自建物理機的集群吞吐量提升了30%,業務高峰期延遲下降了90%;在大數據和AI等計算與數據雙密集場景下,相比傳統的TCP網絡,彈性RDMA高性能網絡的吞吐能力提升30%以上;云原生方面,容器啟動速度快了350%,在Serverless 場景下6秒可拉起3000個彈性容器實例。
為什么要有CIPU?張建鋒認為,過去十多年,云計算技術經歷了兩個發展階段:第一階段是分布式和虛擬化技術替代了大型機,滿足了當時企業所需的算力規模;第二階段出現了資源池化技術,以阿里巴巴為例,通過計算存儲分離架構,將計算、存儲、網絡資源分別池化,突破了規模和穩定性的瓶頸,提供了超大規模的云計算服務。
但隨著數據密集型計算場景的普及,用戶對低時延、高帶寬的需求也越來越高,傳統以CPU為中心的計算體系架構無法適應這一趨勢。為了解決這一問題,阿里云相關研發團隊早在2015年就開始技術攻關,并于2017年推出業內首款虛擬化損耗為零的神龍云服務器。經過多年自研迭代,神龍、彈性RDMA等核心技術不斷深入垂直整合,演進出以CIPU為中心的全新架構形態,云計算開始進入第三階段。
阿里云還不斷夯實技術底座,建立了自研的芯片、服務器、飛天操作系統等軟硬一體的基礎設施。這些基礎設施有力支撐了阿里云產品的四大核心:神龍計算、盤古存儲、洛神網絡和安全內核。在國際權威機構Gartner發布的年度報告里,阿里云獲得計算、存儲、網絡、安全4項單項最高分以及IaaS整體基礎設施能力的全球最高分。
上游新聞記者 楊野