99re6这里有精品热视频,久久综合九色欧美综合狠狠,国产精品久久久久久无毒不卡,av免费无插件在线观看,欧美放荡办公室videos

  1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

浪潮信息“拓荒”:一場(chǎng)面向大模型時(shí)代的性能“壓榨”

 2023-11-03 15:04  來(lái)源:A5專欄  我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

文 | 智能相對(duì)論

作者 | 沈浪

全球人工智能產(chǎn)業(yè)正被限制在了名為“算力”的瓶頸中,一側(cè)是供不應(yīng)求的高端芯片,另一側(cè)則是激戰(zhàn)正酣的“百模大戰(zhàn)”,市場(chǎng)的供求兩端已然失衡。

然而,大多數(shù)人的關(guān)注點(diǎn)仍舊還是在以英偉達(dá)為主導(dǎo)的高端芯片領(lǐng)域。

半導(dǎo)體的創(chuàng)新固然關(guān)鍵,但是從現(xiàn)實(shí)處境來(lái)講,芯片從造出來(lái)到用起來(lái),是一個(gè)龐大的系統(tǒng)工程,市場(chǎng)更需要一條能暫時(shí)繞開半導(dǎo)體創(chuàng)新的系統(tǒng)創(chuàng)新的技術(shù)路徑,來(lái)同步釋放算力,以滿足現(xiàn)階段爆發(fā)性的算力需求以及后期可持續(xù)的常態(tài)發(fā)展。

遵循著這一思路,就不難發(fā)現(xiàn),以浪潮信息為代表的本土廠商已經(jīng)開始了另一條釋放算力的創(chuàng)新路徑,即對(duì)服務(wù)器等硬件的基礎(chǔ)架構(gòu)進(jìn)行創(chuàng)新,在硬件層面“拓荒”,“壓榨”更多的硬件性能,打破算力桎梏。

只是這樣的路徑,似乎沒(méi)有想象中的那么簡(jiǎn)單、輕松。

01 向底層“拓荒”,激活“牛鞭效應(yīng)”

以服務(wù)器為例,一臺(tái)服務(wù)器有超過(guò)10000個(gè)零部件,同時(shí)還涉及30多個(gè)技術(shù)領(lǐng)域,包括材料學(xué)、熱力學(xué)、電池技術(shù)、流體力學(xué)、化學(xué)等一系列學(xué)科。此外,一臺(tái)服務(wù)器里還會(huì)應(yīng)用超過(guò)100種傳輸協(xié)議。其制造過(guò)程更是需要經(jīng)歷30多道流程,使用100多種加工和制造工藝等等。

若要對(duì)這樣的高精密硬件的基礎(chǔ)架構(gòu)進(jìn)行創(chuàng)新,絕非易事。

在四五年前,一些大規(guī)模數(shù)據(jù)中心用戶幾乎都遇到過(guò)一個(gè)相似的問(wèn)題:風(fēng)扇轉(zhuǎn)速越快,硬盤越有可能出現(xiàn)性能波動(dòng),嚴(yán)重時(shí)還會(huì)直接掉線,非常影響硬盤的讀寫性能。

浪潮信息的工程師團(tuán)隊(duì)做了大量實(shí)驗(yàn),最終鎖定原因:風(fēng)扇產(chǎn)生的噪音一旦達(dá)到120分貝,就非常容易造成硬盤磁頭偏移、讀寫效率下降,進(jìn)而導(dǎo)致扇區(qū)失效乃至硬盤報(bào)廢、服務(wù)器宕機(jī)。

盡管這樣的問(wèn)題看起來(lái)很小,卻對(duì)服務(wù)器的性能有著嚴(yán)重制約。如何解決服務(wù)器內(nèi)部的風(fēng)噪問(wèn)題,成為了一個(gè)業(yè)內(nèi)共同探索的議題。國(guó)際開放計(jì)算社區(qū)OCP組織成員包括FaceBook(現(xiàn)為Meta公司)、微軟、浪潮信息、戴爾等企業(yè),共同發(fā)起Storage Vibration(存儲(chǔ)設(shè)備振動(dòng))項(xiàng)目,旨在解決相關(guān)的問(wèn)題。

最終,浪潮信息的工程師們基于大量機(jī)理性研究和測(cè)試,發(fā)現(xiàn)了硬盤性能損失與聲壓強(qiáng)度間的數(shù)學(xué)規(guī)律,并構(gòu)建出業(yè)界首個(gè)硬盤敏感度模型,量化出不同硬盤受到各類噪聲影響后的性能表現(xiàn)。

以此為依據(jù),浪潮信息也得以對(duì)最新G7服務(wù)器系統(tǒng)進(jìn)行了全方位的優(yōu)化設(shè)計(jì),譬如通過(guò)CFD流體動(dòng)力學(xué)仿真改進(jìn)·不同機(jī)箱布局下的風(fēng)扇的葉片形態(tài),抑制扇葉表面因渦流脫落形成的高頻噪音,提升硬盤讀寫效率50%;或是在機(jī)箱內(nèi)通過(guò)設(shè)計(jì)40多種歌院式的消音結(jié)構(gòu),消除特定的高頻噪聲等等。

這些“繡花針”功夫是創(chuàng)新底層架構(gòu)的關(guān)鍵,而看似很微小的基礎(chǔ)改良,卻是提升服務(wù)器性能、保障硬件平穩(wěn)運(yùn)行的重要因素。 在經(jīng)濟(jì)學(xué)領(lǐng)域,有一個(gè)專業(yè)術(shù)語(yǔ)叫作“牛鞭效應(yīng)”,指一端微小的擺動(dòng)被不斷放大,到了另一端將演變?yōu)榇蠓鶖[動(dòng)的趨勢(shì)。

從硬件的應(yīng)用來(lái)看,基礎(chǔ)部件的改良也將激活“牛鞭效應(yīng)”——從一張硬盤到一個(gè)服務(wù)器,再到一個(gè)數(shù)據(jù)中心,隨著硬件不斷疊加應(yīng)用,底層的改良價(jià)值將被逐步放大,向上層傳遞,成為服務(wù)器安全運(yùn)作、釋放算力、促進(jìn)人工智能產(chǎn)業(yè)發(fā)展的重要保障。

類似的,現(xiàn)階段備受關(guān)注的芯片互聯(lián)技術(shù),也是支撐大模型大規(guī)模算力場(chǎng)景的關(guān)鍵技術(shù),尤其是單個(gè)服務(wù)器內(nèi)部芯片高速直連,是實(shí)現(xiàn)大規(guī)模算力集群高效協(xié)同工作的基礎(chǔ)。作為全球領(lǐng)先的服務(wù)器廠商,浪潮信息在高速互連領(lǐng)域定義了業(yè)界第一個(gè)符合OAM(開放加速模塊)規(guī)范的8卡互連硬件系統(tǒng),解決了高速信號(hào)的速率提升和信號(hào)失真問(wèn)題,實(shí)現(xiàn)開放加速規(guī)范下芯片互連的最高速率,助力著人工智能產(chǎn)業(yè)的持續(xù)突破。

02 一場(chǎng)對(duì)性能的極限“壓榨”

在人工智能行業(yè),算力的巨大需求和供給緊張已然是擺上臺(tái)面的事實(shí)。為什么業(yè)內(nèi)廠商想要不斷地改進(jìn)傳統(tǒng)的硬件架構(gòu)去釋放算力,哪怕只是一點(diǎn)細(xì)微的聲噪優(yōu)化,都不遺余力地花上四五年的時(shí)間去研究、探索和創(chuàng)新。

細(xì)究來(lái)說(shuō),算力的供應(yīng)大抵可以歸結(jié)為兩條路徑,一是“增量拓展”,比如接入更多的服務(wù)器、建更多的數(shù)據(jù)中心,通過(guò)“堆量”的方式來(lái)提供更多的算力。二是“存量?jī)?yōu)化”,對(duì)原有架構(gòu)、原有機(jī)器進(jìn)行優(yōu)化升級(jí),通過(guò)“提質(zhì)”的方式來(lái)把性能和效率提升起來(lái)。

其中,在這兩條路徑之下,“存量?jī)?yōu)化”又是必然的一條。無(wú)關(guān)乎未來(lái)算力是否緊張或?qū)捲?,如何?duì)現(xiàn)有的機(jī)器和架構(gòu)進(jìn)行升級(jí)優(yōu)化,是行業(yè)發(fā)展的一個(gè)重要階段,只是時(shí)間早晚的問(wèn)題。

值得一提的是,現(xiàn)階段,服務(wù)器行業(yè)已經(jīng)有著充分的理由去推進(jìn)“存量?jī)?yōu)化”這一路徑。

一方面,算力領(lǐng)域正在面臨著高端芯片緊張的問(wèn)題,“增量拓展”被限制,那么業(yè)內(nèi)廠商就不得不考慮“存量?jī)?yōu)化”的事情。

另一方面,源于服務(wù)器的特殊性,在服務(wù)器概念上的簡(jiǎn)單的“堆量”只能堆出各種形態(tài)和規(guī)格的服務(wù)器,但對(duì)數(shù)據(jù)中心計(jì)算能力的提升并沒(méi)有什么實(shí)質(zhì)性的幫助。

對(duì)此,在2014年,浪潮信息提出了“融合架構(gòu)”的技術(shù)理念,旨在創(chuàng)造一種新的體系架構(gòu),將硬件設(shè)備中的同類資源整合成一個(gè)資源池,即便是不同的設(shè)備也能夠任意地整合,再通過(guò)軟件動(dòng)態(tài)感知業(yè)務(wù)的資源需求,從而利用硬件重組的能力來(lái)滿足各類應(yīng)用的性能需求。

這種“融合架構(gòu)”看似是“增量拓展”,但核心則是“存量?jī)?yōu)化”。直到融合架構(gòu)3.0的發(fā)布,就可以清晰地看到,這一技術(shù)理念打破了現(xiàn)有服務(wù)器的邏輯架構(gòu)和應(yīng)用模式,實(shí)現(xiàn)了整機(jī)柜級(jí)別的計(jì)算、內(nèi)存、存儲(chǔ)與互聯(lián)等各種IT資源的池化,形成了以系統(tǒng)設(shè)計(jì)為中心的新架構(gòu)模式,對(duì)構(gòu)建高速高性能的互聯(lián)網(wǎng)絡(luò)起到了重要作用。

簡(jiǎn)單來(lái)說(shuō),基于“池化”的概念,融合架構(gòu)3.0將服務(wù)器內(nèi)的計(jì)算資源、存儲(chǔ)資源、內(nèi)存資源、異構(gòu)加速資源等核心IT資源重新細(xì)化,并做了“重組”,從而能使其發(fā)揮出更高的性能和應(yīng)用價(jià)值。

這相當(dāng)于對(duì)現(xiàn)有的服務(wù)器性能做了一次極限地“壓榨”。 眾所周知,傳統(tǒng)服務(wù)器的性能利用率是無(wú)法達(dá)到100%,兩臺(tái)服務(wù)器相連得到大多是1+1<2結(jié)果,而基于融合架構(gòu)3.0的支持,就有可能實(shí)現(xiàn)1+1>2的情況。

當(dāng)然,這只是一個(gè)便于理解的理想化公式,現(xiàn)實(shí)大抵是達(dá)不到這個(gè)效果的。但是,其中的進(jìn)步也是看得見的,特別是隨著服務(wù)器的增加,當(dāng)我們?cè)賮?lái)估算1+1+1+...+N的效果時(shí),在融合架構(gòu)3.0下的服務(wù)器便能發(fā)揮出遠(yuǎn)超傳統(tǒng)架構(gòu)的性能和價(jià)值。

這是融合架構(gòu)3.0的價(jià)值展望,同時(shí)也是“存量?jī)?yōu)化”這一路徑在服務(wù)器行業(yè)的價(jià)值呈現(xiàn)。正如上文提及的“牛鞭效應(yīng)”,當(dāng)?shù)讓蛹?xì)微的創(chuàng)新不斷被放大到一個(gè)硬件、一個(gè)計(jì)算集群、一個(gè)產(chǎn)業(yè)生態(tài),那么其發(fā)揮出來(lái)的作用將遠(yuǎn)超過(guò)往。

03 在算力之外

當(dāng)前,在服務(wù)器行業(yè),就能看到類似的信號(hào)。

繼續(xù)以融合架構(gòu)3.0為例,其打破了以往“以CPU為中心”的設(shè)計(jì)理念,從整體出發(fā),以系統(tǒng)為中心,通過(guò)硬件解耦將異構(gòu)計(jì)算、內(nèi)存、存儲(chǔ)等資源轉(zhuǎn)變?yōu)榭瑟?dú)立擴(kuò)展的資源池。

在這個(gè)過(guò)程中,不僅實(shí)現(xiàn)了亞微秒級(jí)遠(yuǎn)端內(nèi)存訪問(wèn),并且還構(gòu)建出了一種邏輯上可遠(yuǎn)端共享的內(nèi)存資源池,讓多臺(tái)主機(jī)訪問(wèn)同一個(gè)內(nèi)存池,從而大大提高了數(shù)據(jù)交換的效率,讓Spark、Hadoop和機(jī)器學(xué)習(xí)等使用分布式數(shù)據(jù)框架的應(yīng)用,能夠更順暢地實(shí)現(xiàn)框架內(nèi)各節(jié)點(diǎn)間的數(shù)據(jù)交換與協(xié)作。

也就是說(shuō),融合架構(gòu)3.0解決的不僅僅是服務(wù)器性能、算力釋放等問(wèn)題,實(shí)際上還繼續(xù)向上層拓展,解決了系統(tǒng)應(yīng)用的問(wèn)題——服務(wù)器的架構(gòu)創(chuàng)新在算力之外,帶來(lái)了全新的價(jià)值呈現(xiàn)。

類似的,放眼全球市場(chǎng),微軟與英偉達(dá)合作推出的虛擬機(jī)Azure ND H100 v5 VM系列,正基于強(qiáng)大的硬件能力支持結(jié)合Quantum-2InfiniBand網(wǎng)絡(luò)互連,從而幫助企業(yè)更好、更高效地處理生成式AI任務(wù)。

現(xiàn)階段,大多數(shù)硬件升級(jí)并非單線的,而是考慮到上層的應(yīng)用需求,如大模型訓(xùn)練、生成式AI任務(wù)等,結(jié)合軟件系統(tǒng)、網(wǎng)絡(luò)服務(wù)等進(jìn)行融合創(chuàng)新,從而為應(yīng)用場(chǎng)景服務(wù)。

縱觀當(dāng)前人工智能產(chǎn)業(yè)在算力層面的困頓處境,以算力牽動(dòng)整個(gè)人工智能產(chǎn)業(yè)的發(fā)展是必然的趨勢(shì)。而業(yè)內(nèi)廠商在解決算力供給問(wèn)題的過(guò)程,也將同步帶動(dòng)其他模塊的升級(jí)。換句話說(shuō),解決算力問(wèn)題就不能局限在高端芯片領(lǐng)域,更要從其他的路徑尋求多元化的發(fā)展。

在這個(gè)階段,以英偉達(dá)為主導(dǎo)的高端芯片領(lǐng)域和以浪潮信息為代表的服務(wù)器硬件升級(jí),都將站在市場(chǎng)的聚光燈下。今天的市場(chǎng),需要更多元、更勇敢、更執(zhí)著的探索者、創(chuàng)新者。

*本文圖片均來(lái)源于網(wǎng)絡(luò)

#智能相對(duì)論 Focusing on智能新產(chǎn)業(yè)新服務(wù),這是智能的服務(wù)NO.247 深度解讀

此內(nèi)容為【智能相對(duì)論】原創(chuàng),

僅代表個(gè)人觀點(diǎn),未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

部分圖片來(lái)自網(wǎng)絡(luò),且未核實(shí)版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請(qǐng)作者與我們聯(lián)系。

•AI產(chǎn)業(yè)新媒體;

•澎湃新聞科技榜單月度top5;

•文章長(zhǎng)期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能 十萬(wàn)個(gè)為什么》

•【重點(diǎn)關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機(jī)、無(wú)人機(jī)等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機(jī)器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計(jì)算、開發(fā)者以及背后的芯片、算法等。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
大模型

相關(guān)文章

  • 未來(lái)5年,中國(guó)AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)
  • 真正的「國(guó)產(chǎn)英偉達(dá)」來(lái)了

    文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取

    標(biāo)簽:
    英偉達(dá)
  • AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    AI視頻生成賽道“分野”:小廠重產(chǎn)品,大廠重生態(tài)

    標(biāo)簽:
    騰訊
    阿里巴巴
    快手
  • 數(shù)據(jù)庫(kù)進(jìn)入“內(nèi)存自由”時(shí)代!阿里云PolarDB發(fā)布全球首個(gè)CXL數(shù)據(jù)庫(kù)服務(wù)器

    技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar

  • 為AI時(shí)代云服務(wù)器量身定制 阿里云操作系統(tǒng)Alinux 4重磅發(fā)布

    2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS

  • 阿里云重磅發(fā)布AI安全護(hù)欄 五項(xiàng)安全能力護(hù)航AI安全

    9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過(guò)去的一年,AIAgent正在

  • 魔搭社區(qū)國(guó)際版上線,并發(fā)布科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎

    9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無(wú)限”的專題論壇,并發(fā)布魔搭社區(qū)國(guó)際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今,魔搭社區(qū)已成長(zhǎng)為中國(guó)最大AI開源社區(qū),其模型數(shù)量已突破10萬(wàn),服務(wù)了全球20

  • 七連發(fā)!阿里多款重磅發(fā)布亮相云棲大會(huì)

    9月24日,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語(yǔ)言、語(yǔ)音、視覺(jué)、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實(shí)現(xiàn)突破。在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)G

  • 阿里云擴(kuò)建全球基礎(chǔ)設(shè)施,將新增巴西、法國(guó)和荷蘭數(shù)據(jù)中心

    9月24日,阿里云在云棲大會(huì)上宣布新一輪全球基礎(chǔ)設(shè)施擴(kuò)建計(jì)劃:將在巴西、法國(guó)和荷蘭首次設(shè)立云計(jì)算地域節(jié)點(diǎn)(region),并將擴(kuò)建墨西哥、日本、韓國(guó)、馬來(lái)西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長(zhǎng)的AI和云計(jì)算需求。目前,阿里云在全球29個(gè)地區(qū)運(yùn)營(yíng)91個(gè)可用區(qū),是中國(guó)最大、亞太第一的云服務(wù)商

編輯推薦