云計(jì)算話語(yǔ)權(quán)之爭(zhēng),阿里云祭出自研強(qiáng)招


撰文/ 何己派
跨過(guò)年度盈利節(jié)點(diǎn)的阿里云,正加速邁向下一個(gè)周期。
今年,這家云巨頭的關(guān)鍵詞是“回歸本質(zhì)”,既指商業(yè)層面,追求更健康、更可持續(xù)的增長(zhǎng),也指技術(shù)本源的回歸。
6月13日,一年一度的阿里云峰會(huì)上,阿里云智能總裁張建鋒用“Back to Basic”的口號(hào)開(kāi)場(chǎng),提出要回到云計(jì)算的本質(zhì)。
以Back to Basic的心態(tài)做B2B的生意,一語(yǔ)雙關(guān)。
“云計(jì)算進(jìn)入了一個(gè)關(guān)鍵的突破期,如果我們定義好下一代技術(shù),中國(guó)云計(jì)算就有超車機(jī)會(huì)。”張建鋒說(shuō)。
阿里云智能總裁張建鋒發(fā)布CIPU
承載這一使命的關(guān)鍵,是橫空出世的新型云數(shù)據(jù)中心專用處理器CIPU。阿里云表示,它將替代CPU,成為云時(shí)代IDC的管控和加速核心。
放眼國(guó)際,云廠商加碼自研云計(jì)算服務(wù)器,漸成趨勢(shì)。阿里云欲重新定義云計(jì)算底座,底氣來(lái)自何處?
深水區(qū)
要探討阿里云為何重倉(cāng)自研技術(shù),先來(lái)看看行業(yè)背景。
從100%上云的北京冬奧會(huì),到號(hào)稱全世界最繁忙網(wǎng)站之一的12306,云計(jì)算改變了算力的生產(chǎn)和輸出方式,融入人們的生活,成為關(guān)鍵社會(huì)基礎(chǔ)設(shè)施。
回顧云計(jì)算的發(fā)展歷程,在張建鋒看來(lái),技術(shù)經(jīng)歷了兩個(gè)發(fā)展階段。
第一個(gè)階段,互聯(lián)網(wǎng)企業(yè)高速成長(zhǎng),帶來(lái)極強(qiáng)的算力彈性需求,推動(dòng)著以分布式和虛擬化為代表的云計(jì)算技術(shù),替代了過(guò)去的大型機(jī)。
第二階段,企業(yè)對(duì)算力可用性和可靠性的要求不斷提升,倒逼阿里云等云計(jì)算公司將計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源池化,構(gòu)建計(jì)算存儲(chǔ)分離架構(gòu),以云原生方式重新設(shè)計(jì)整個(gè)架構(gòu)和軟件。
由于資源池化技術(shù)的誕生,規(guī)模和穩(wěn)定性的瓶頸得以突破,為企業(yè)業(yè)務(wù)的擴(kuò)展,提供超大規(guī)模的云計(jì)算服務(wù)。
在這個(gè)過(guò)程中,客戶上云的需求、技術(shù)的更迭速度較快,既要求技術(shù)面廣,又要求技術(shù)深度,做云成為一門(mén)技術(shù)活。
廠商只有具備持續(xù)研發(fā)能力,不斷積累、更新和優(yōu)化技術(shù),才能建立壁壘,滿足市場(chǎng)需求。
因此,發(fā)展十余年來(lái),云計(jì)算變得越來(lái)越硬,亞馬遜的AWS、微軟的Azure、阿里巴巴的阿里云等,頭部企業(yè)皆堅(jiān)持自主研發(fā),且保持高強(qiáng)度的自研節(jié)奏,不局限于數(shù)字云化,向著一站式技術(shù)平臺(tái)進(jìn)階。
其實(shí),論技術(shù)能力,以阿里云為代表的中國(guó)云廠商,并不輸其他國(guó)際巨頭。
阿里云自研的飛天,是中國(guó)唯一自研的云操作系統(tǒng),單集群可達(dá)10萬(wàn)臺(tái)規(guī)模,千億級(jí)文件數(shù),EB級(jí)別存儲(chǔ)空間,可將遍布全球的上百萬(wàn)臺(tái)服務(wù)器連接成一臺(tái)超級(jí)計(jì)算機(jī)。
去年11月,Gartner發(fā)布2021年IaaS+PaaS綜合解決方案記分卡,阿里云在全球被評(píng)估的供應(yīng)商中,得分第三高。
買(mǎi)設(shè)備還是從頭自研,面對(duì)這個(gè)問(wèn)題,阿里云沒(méi)有糾結(jié)。2009年,阿里云成立不久,工程師便寫(xiě)下“飛天”的第一行代碼。
如今13年過(guò)去,其運(yùn)營(yíng)的服務(wù)器已超過(guò)上百萬(wàn)臺(tái),建立了覆蓋全球的算力基礎(chǔ)設(shè)施,服務(wù)400萬(wàn)付費(fèi)用戶。
期間,行業(yè)云卷云舒,那些前期沒(méi)有太多技術(shù)投入的廠商,交完“學(xué)費(fèi)”即遺憾退場(chǎng),驗(yàn)證了拿來(lái)主義蓋不起高樓大廈,自主研發(fā)的云才能走得更遠(yuǎn)。
從“神龍”計(jì)算、“盤(pán)古”存儲(chǔ)到“洛神”網(wǎng)絡(luò),阿里云的整套自研技術(shù)體系共同融合,支撐算力如同水電一般供到千家萬(wàn)戶。
“今天我們可以很自豪地講,阿里云的云計(jì)算從端到端,核心技術(shù)都是自研的。”張建鋒說(shuō)。
來(lái)源:視覺(jué)中國(guó)
話語(yǔ)權(quán)
當(dāng)下,云計(jì)算進(jìn)入一個(gè)新的關(guān)鍵突破期。
隨著數(shù)據(jù)密集型的計(jì)算越來(lái)越多,提升了對(duì)云計(jì)算提供的低時(shí)延、高帶寬的需求,而這些需求很難通過(guò)傳統(tǒng)體系結(jié)構(gòu)的優(yōu)化來(lái)滿足。挑戰(zhàn)在于三方面:
其一,基于傳統(tǒng)的以CPU為中心的計(jì)算體系架構(gòu),出現(xiàn)計(jì)算和網(wǎng)絡(luò)傳輸時(shí)延大的問(wèn)題;
其二,大數(shù)據(jù)應(yīng)用持續(xù)增多,導(dǎo)致數(shù)據(jù)中心內(nèi)部數(shù)據(jù)遷移量增多;
其三,管理的基礎(chǔ)設(shè)施規(guī)模越來(lái)越大、越來(lái)越復(fù)雜。以阿里云為例,其在全球27個(gè)國(guó)家和地區(qū)、84個(gè)可用區(qū),管理著上百萬(wàn)臺(tái)服務(wù)器,傳統(tǒng)架構(gòu)無(wú)法解決超大規(guī)模的復(fù)雜管理問(wèn)題。
通過(guò)軟件定義的方法,基于傳統(tǒng)的、以CPU為中心的計(jì)算體系架構(gòu)來(lái)做優(yōu)化,這套范式已觸及瓶頸。
新舊轉(zhuǎn)換的拐點(diǎn),呼喚全新的技術(shù)體系。誰(shuí)能以更具競(jìng)爭(zhēng)力的產(chǎn)品制定行業(yè)規(guī)則,誰(shuí)就能掌握下一輪競(jìng)爭(zhēng)的話語(yǔ)權(quán)。
近年來(lái),越來(lái)越多云廠商強(qiáng)調(diào)軟硬結(jié)合,紛紛自研服務(wù)器和芯片,即能證明這點(diǎn)。
阿里云給出的答案是,從數(shù)據(jù)中心的內(nèi)部體系結(jié)構(gòu)做革新,從以CPU為中心的“馬車時(shí)代”,向以飛天操作系統(tǒng)+CIPU為中心的“汽車時(shí)代”升級(jí)。
早在2015年,阿里云相關(guān)研發(fā)團(tuán)隊(duì)就開(kāi)始技術(shù)攻關(guān),2017年,推出業(yè)內(nèi)首款虛擬化損耗為零的神龍?jiān)品?wù)器。
經(jīng)過(guò)多年自研迭代,神龍、彈性RDMA等核心技術(shù)不斷深入垂直整合,以CIPU為中心的全新架構(gòu)形態(tài),開(kāi)始成型。
據(jù)張建鋒介紹,CIPU是為新型云數(shù)據(jù)中心設(shè)計(jì)的專用處理器,它向下接入物理的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源,快速云化并進(jìn)行硬件加速;向上接入飛天云操作系統(tǒng),管控阿里云全球上百萬(wàn)臺(tái)服務(wù)器。
CIPU架構(gòu)示意圖
從具體特性來(lái)看:
CIPU與計(jì)算結(jié)合,能快速接入不同類型資源的服務(wù)器,帶來(lái)算力虛擬化損耗降至“0”,以及硬件級(jí)安全的加固隔離;
與存儲(chǔ)結(jié)合,對(duì)存算分離架構(gòu)的塊存儲(chǔ)接入進(jìn)行硬件加速,云盤(pán)存儲(chǔ)IOPS最高可達(dá)300萬(wàn),長(zhǎng)尾時(shí)延降低50%;
與網(wǎng)絡(luò)結(jié)合,可對(duì)高帶寬物理網(wǎng)絡(luò)進(jìn)行硬件加速,構(gòu)建大規(guī)模彈性RDMA高性能網(wǎng)絡(luò),時(shí)延最低可達(dá)5us。
簡(jiǎn)而言之,物理機(jī)一樣的性能,遠(yuǎn)超物理機(jī)的敏捷性,以及云計(jì)算的彈性。
三大特性里,尤其值得一提的是網(wǎng)絡(luò)這塊,CIPU實(shí)現(xiàn)了RDMA技術(shù)的普惠化。
阿里云技術(shù)產(chǎn)品負(fù)責(zé)人蔣江偉提到,RDMA是門(mén)“貴族化”的技術(shù),對(duì)工程師、代碼、硬件投入的要求都非常高,阿里云基于CIPU+飛天的架構(gòu)推出彈性RDMA技術(shù),能讓所有中小企業(yè)享受到大企業(yè)才能獲取的技術(shù)紅利。
他們?cè)诎⒗镌粕祥_(kāi)發(fā)幾乎不用改代碼,使用的操作系統(tǒng)是全兼容的。
站在客戶使用的視角,CIPU的升級(jí)是無(wú)感的,已融入阿里云整體的云平臺(tái),不需要做任何應(yīng)用調(diào)整、修改任何代碼,但在取用時(shí),能明顯感知到云算力的調(diào)度效率和性能有了大幅提升。
用阿里云虛擬化技術(shù)負(fù)責(zé)人蔣林泉的話說(shuō),“CIPU是跑在我們的云操作系統(tǒng)底下的,客戶的應(yīng)用跑上來(lái),只會(huì)覺(jué)得更快、更敏捷、更靈活。”
CIPU特性簡(jiǎn)介
變速期
進(jìn)入2022年,中國(guó)云計(jì)算市場(chǎng)穩(wěn)中有變。
市場(chǎng)調(diào)研機(jī)構(gòu)Canalys6月初公布的數(shù)據(jù)顯示,2022年第一季度,中國(guó)大陸云基礎(chǔ)設(shè)施服務(wù)支出同比增長(zhǎng)21%,達(dá)到73億美元。盡管云服務(wù)總支出低于預(yù)期,但中國(guó)市場(chǎng)領(lǐng)跑全球云服務(wù)市場(chǎng)的增長(zhǎng)。
市場(chǎng)份額排名方面,阿里云牢牢把控第一的位置,與華為云、騰訊云和百度智能云一起,受益于云計(jì)算使用規(guī)模的持續(xù)擴(kuò)張,“四朵云”占中國(guó)云服務(wù)總支出達(dá)到79%,同比增長(zhǎng)了19%。
需求側(cè),互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)企業(yè)仍是主力軍,同時(shí)傳統(tǒng)企業(yè)提速上云勢(shì)不可擋,政府、金融、醫(yī)療健康等領(lǐng)域客戶的規(guī)模占比,未來(lái)將進(jìn)一步提高。
供應(yīng)側(cè),云的角逐已至中場(chǎng),缺乏核心競(jìng)爭(zhēng)力和議價(jià)能力的廠商,或光速出局或深陷虧損內(nèi)耗,行業(yè)參與者從以往的低質(zhì)競(jìng)爭(zhēng),轉(zhuǎn)向精耕細(xì)作。
在這樣的背景下,中國(guó)云服務(wù)商里目前唯一實(shí)現(xiàn)了盈虧平衡的阿里云,開(kāi)始進(jìn)入高質(zhì)量發(fā)展階段。站在千億營(yíng)收規(guī)模的新起點(diǎn),眼中的風(fēng)景已然不同。
在張建鋒看來(lái),阿里云發(fā)布的新一代云計(jì)算體系,不僅會(huì)對(duì)云、對(duì)數(shù)據(jù)中心內(nèi)部產(chǎn)生影響,也將改變傳統(tǒng)計(jì)算機(jī)終端形態(tài),以及軟件應(yīng)用和開(kāi)發(fā)界面。
其中,在計(jì)算機(jī)終端維度,阿里云此次峰會(huì)上推出的云電腦無(wú)影,進(jìn)行了再次升級(jí),支持開(kāi)發(fā)者打造8K畫(huà)質(zhì)體驗(yàn),并將時(shí)延控制在20毫秒內(nèi)。
“云計(jì)算越來(lái)越接近進(jìn)入下一個(gè)時(shí)代——全新的架構(gòu)定義,全新的軟件界面,硬件加速。我們錯(cuò)過(guò)了PC時(shí)代,但云時(shí)代,大家起步是一樣的。現(xiàn)在是重新定義云的窗口期,如果我們定義好了,中國(guó)就可以在下一個(gè)技術(shù)時(shí)代有自己的一席之地。”張建鋒表示。
一個(gè)容易被忽視的細(xì)節(jié)是,張建鋒在發(fā)言中提到,為了無(wú)法計(jì)算的價(jià)值,是阿里云不變的使命。在一些城市機(jī)場(chǎng),阿里云的廣告回歸“為了無(wú)法計(jì)算的價(jià)值”這一最初版本,這是其2015年提出的口號(hào)。