關(guān)注

首頁(yè) > 關(guān)注 > 正文

被榨干的AI算力，誰(shuí)將成為解藥？-微資訊

發(fā)布時(shí)間：2023-04-21 04:07:17 來(lái)源：獵云網(wǎng)

要投的早投了，沒(méi)投的也在路上。

來(lái)源：獵云精選；文/孫媛

大模型這股熱風(fēng)，已經(jīng)吹到了上游算力。

(相關(guān)資料圖)

隨著百度、騰訊、阿里等紛紛拿出相關(guān)技術(shù)布局以及底層設(shè)施儲(chǔ)備，為中國(guó)的ChatGPT奮力一戰(zhàn)，密集上線的大模型面臨著巨大的算力需求，“算力從何而來(lái)”的問(wèn)題隨之搬上臺(tái)面。

一方面，算力昂貴。以ChatGPT為例，支撐其算力至少需要上萬(wàn)顆英偉達(dá)的GPU A100，單次模型訓(xùn)練成本超過(guò)1200萬(wàn)美元。

另一方面，算力有限。今年4月5日，Open AI就因需求量過(guò)大為由關(guān)閉過(guò)ChatGPT Plus的付費(fèi)渠道，這意味著僅發(fā)布幾個(gè)月，OpenAI就曾面臨算力缺口。

那么問(wèn)題就來(lái)了，GPU燒錢且有限的算力現(xiàn)況，對(duì)于大模型來(lái)說(shuō)是否就是最優(yōu)解？

“蹭”大模型和AIGC的熱度，業(yè)內(nèi)也涌現(xiàn)技術(shù)及方案的“混戰(zhàn)”。國(guó)內(nèi)外云計(jì)算大廠發(fā)力自研芯片和軟硬件系統(tǒng)優(yōu)化、二級(jí)市場(chǎng)CPO（共封裝光學(xué)）概念股一路飆升、存算跳出來(lái)說(shuō)是“突破困境的清晰路線”、量子計(jì)算更是被認(rèn)為“最具潛力的破局者”。

在投算力未來(lái)上，投資人也開(kāi)始兵分幾路，有人堅(jiān)定燒GPU、有人開(kāi)始刷起模型訓(xùn)練優(yōu)化的項(xiàng)目，更有投資過(guò)存算、Chiplet的VC計(jì)劃在賽道內(nèi)尋找更優(yōu)的投資標(biāo)的，還有投資量子計(jì)算的機(jī)構(gòu)在期待從底層到上層的一場(chǎng)算力革命的大爆發(fā)。

儼然，這場(chǎng)“算力軍備競(jìng)賽”在一級(jí)市場(chǎng)，已經(jīng)暗潮涌動(dòng)。

國(guó)產(chǎn)GPU：以量取勝

大模型的發(fā)展有算法、算力、數(shù)據(jù)三大重要因素。

算力是大模型訓(xùn)練的重要能量引擎，也是目前國(guó)內(nèi)發(fā)展大模型產(chǎn)業(yè)的一大壁壘。芯片能力直接影響著高算力訓(xùn)練效果和速度，故而高端GPU芯片的數(shù)量多少，成為業(yè)內(nèi)判斷企業(yè)大模型能力的重要指標(biāo)。

然而，對(duì)于國(guó)內(nèi)大模型玩家而言，高端GPU芯片面臨著進(jìn)口受限的問(wèn)題，已經(jīng)由“買不買得起”變?yōu)椤坝貌挥玫蒙稀薄?jù)此前媒體報(bào)道，國(guó)內(nèi)云廠商主要采用的是英偉達(dá)的中低端性能產(chǎn)品，譬如GPU A800。

在國(guó)外芯片能否撐起大模型的算力需求疑問(wèn)下，一眾GPU國(guó)產(chǎn)廠商也在抓住國(guó)產(chǎn)替代的契機(jī)。

但是，國(guó)內(nèi)GPU芯片的云端訓(xùn)練公司如壁仞科技（通用GPU芯片BR100）、天數(shù)智芯（“智鎧100”）、寒武紀(jì)（云端推理思元270）的產(chǎn)品雖在多媒體和圖形處理的單精度浮點(diǎn)計(jì)算FP32的理論指標(biāo)上做得不錯(cuò)，但沒(méi)有處理FP64的能力。

而大模型訓(xùn)練需要處理高顆粒度的信息，對(duì)云端訓(xùn)練芯片的芯片處理信息的精細(xì)度和算力速度要求更高，在超算領(lǐng)域，雙精度浮點(diǎn)計(jì)算能力FP64是進(jìn)行高算力計(jì)算的硬性指標(biāo)。

英偉達(dá)的A100就同時(shí)具備上述兩類能力。

根據(jù)公開(kāi)消息，目前國(guó)內(nèi)唯一支持FP64雙精度浮點(diǎn)運(yùn)算的只有海光推出的DCU（協(xié)處理器），但是它的性能只有A100的60%左右。

對(duì)此，戈壁創(chuàng)投VP俞悅坦言，雖然目前燒GPU是最為現(xiàn)實(shí)的方案，但就國(guó)內(nèi)GPU廠商的角度，還需要更多時(shí)間去追趕。

普華資本合伙人蔣純則認(rèn)為，技術(shù)差距是一方面，還有一方面是美國(guó)卡脖子的問(wèn)題，這就要求國(guó)內(nèi)企業(yè)想做高端GPU芯片，要有能力走出一條從設(shè)備到材料，完全國(guó)產(chǎn)化的道路。如果做不到，就只能退而求其次。

但這樣的國(guó)產(chǎn)GPU對(duì)于大模型是否就無(wú)用了？不然。

蔣純進(jìn)一步解釋，國(guó)產(chǎn)GPU即便做不出最強(qiáng)大，但也能做出目前所需要的產(chǎn)品，只是更多是以低端的GPU去追趕和堆疊，讓一堆GPU通過(guò)優(yōu)化和協(xié)調(diào)來(lái)協(xié)同作用，即以量取勝、再去組合模擬優(yōu)化的路徑。

值得注意的是，GPU越堆越多，內(nèi)部管理的難度也就越大，故而提高GPU并行運(yùn)行的資源利用率，做模型推理/訓(xùn)練優(yōu)化的項(xiàng)目也開(kāi)始在VC圈開(kāi)始涌現(xiàn)，成為了一線投資人研究的方向之一。

但就蔣純來(lái)說(shuō)，這類項(xiàng)目雖然有價(jià)值，也是個(gè)不錯(cuò)的方向，但并不足以戳中他的心巴。他坦言，有時(shí)候有價(jià)值的事不一定有好的商業(yè)模式。

“就系統(tǒng)來(lái)說(shuō)，阿里、華為等大廠一定比小公司有優(yōu)勢(shì)。因?yàn)榧夹g(shù)從大環(huán)境里磨練出來(lái)，最后應(yīng)用到大環(huán)境里。創(chuàng)業(yè)公司獨(dú)立做，大公司一上來(lái)就學(xué)走了，要不就是技術(shù)賣給大廠?！?/p>

而就GPU芯片而言，大廠又未必有絕對(duì)優(yōu)勢(shì)，反倒給了創(chuàng)業(yè)公司機(jī)會(huì)。

他表示，雖然大廠有資金、場(chǎng)景，但存在一個(gè)老問(wèn)題，就是以部門形式來(lái)做，無(wú)法做到創(chuàng)業(yè)公司all in的 “瘋狂”。而芯片有知識(shí)產(chǎn)權(quán)以及商業(yè)壁壘，創(chuàng)業(yè)公司有能力將芯片賣給大廠。

GPU“防守”，存算“包抄”

值得注意的是，燒GPU，并非長(zhǎng)久之策。

動(dòng)輒幾億算力投入的模型訓(xùn)練階段只是開(kāi)始，模型推理應(yīng)用階段算力成本更是可能高達(dá)百億級(jí)別。大算力之下，背后的功耗更是驚人。

環(huán)球零碳研究中心曾粗略合計(jì)了ChatGPT全生命周期的碳足跡：自 2022 年 11 月 30 日運(yùn)行以來(lái)，其制造設(shè)備的碳排放量超過(guò)了33. 41 噸，模型訓(xùn)練碳排放超過(guò) 552 噸，運(yùn)行 60 天碳排放約為229. 2 噸。

而隨著模型越來(lái)越大，按照傳統(tǒng)方式計(jì)算將越來(lái)越麻煩。而國(guó)內(nèi)想用高端GPU這一傳統(tǒng)的數(shù)字電路方法來(lái)解決大算力，存在上游材料、設(shè)備等根本障礙，短期難以解決。

面對(duì)未來(lái)潛在的算力指數(shù)增長(zhǎng)，也有不少企業(yè)和VC開(kāi)啟了換擋操作，以存算、Chiplet等技術(shù)，來(lái)達(dá)到能夠支撐大模型的算力。

其中，就存算賽道來(lái)說(shuō)，身處一線的蔣純明顯感覺(jué)到變熱鬧了。

2019年投知存科技時(shí)，他發(fā)現(xiàn)很多人還不知道存內(nèi)計(jì)算，而現(xiàn)在這個(gè)高技術(shù)壁壘的賽道，他觀察到創(chuàng)業(yè)公司可能有近10家，且熱度還在持續(xù)升溫。

“越來(lái)越多人會(huì)發(fā)現(xiàn)存內(nèi)計(jì)算在全球的大模型時(shí)代非常重要。傳統(tǒng)的計(jì)算機(jī)體系架構(gòu)是適應(yīng)計(jì)算密集型應(yīng)用的，而現(xiàn)在AI都是數(shù)據(jù)密集型應(yīng)用，所以一定要有新的架構(gòu)來(lái)更好地應(yīng)對(duì)AI這種數(shù)據(jù)密集型應(yīng)用。從原理上來(lái)說(shuō)，存內(nèi)計(jì)算是一種解決AI算力需求的根本性手段，而且相較于量子計(jì)算、光計(jì)算而言更有望在短期內(nèi)實(shí)現(xiàn)出來(lái)。芯粒跟堆疊也會(huì)對(duì)AI類計(jì)算提供幫助。”

蔣純表示，存算即用器件本身特性來(lái)算，相當(dāng)于是一次并行計(jì)算，譬如ChatGPT 1700多億參數(shù)，傳統(tǒng)的數(shù)字電路要算很多次，而存算可能一個(gè)節(jié)拍就能算完。至于堆疊，則是將一片memory和一片邏輯電路堆在一起，創(chuàng)造了一個(gè)有巨大內(nèi)存的CPU，應(yīng)用在大模型上就會(huì)非常好地加速運(yùn)算。

蔣純對(duì)賽道的感受的確也跟公開(kāi)數(shù)據(jù)表現(xiàn)相一致。

據(jù)企查查數(shù)據(jù)顯示，存算賽道2018年-2019年融資交易數(shù)量為11筆，而2020年至今，融資交易數(shù)為28筆，其中有22筆集中在2021年至2022年間，加速態(tài)勢(shì)明顯。

但他也指出，目前全球已經(jīng)商用的存算還是用在邊緣端，譬如高保真降噪耳機(jī)等，以低功耗帶來(lái)高算力。與此同時(shí)，從公司戰(zhàn)略上來(lái)看，目前存算企業(yè)可分為兩派。

一派是上來(lái)就大容量的計(jì)算，要狂投入研發(fā)成本，短期看不出結(jié)果，融資幾輪估值上百億，但最后沒(méi)有成果，就會(huì)越到后面越難做，可能就無(wú)人接盤；而另一派則是小步快跑，先流片、應(yīng)用，甚至搭生態(tài)，邊研發(fā)邊回血，讓投資人有信心續(xù)投，也是蔣純認(rèn)為國(guó)內(nèi)存算企業(yè)更現(xiàn)實(shí)的發(fā)展戰(zhàn)略。

據(jù)他觀察，現(xiàn)在大模型出來(lái)之后，投資人在看到市場(chǎng)的前景下，對(duì)這兩派存算企業(yè)都有意愿去投錢，即使當(dāng)下沒(méi)有成果展示。

“我們投的時(shí)候，這些技術(shù)肯定有很多的不確定性，譬如能不能做出來(lái)，能不能成為主流?，F(xiàn)在來(lái)看確定性是越來(lái)越高了，存算企業(yè)都在做大模型支撐的相關(guān)研發(fā)，優(yōu)質(zhì)項(xiàng)目會(huì)呈現(xiàn)加速發(fā)展的態(tài)勢(shì)。我認(rèn)為5年內(nèi)，存算能夠成為一個(gè)比較成熟的解決方案，甚至有可能是主流解決方案?！?/p>

在這場(chǎng)全球技術(shù)較量中，蔣純認(rèn)為GPU跟存算是合大于競(jìng)的關(guān)系：GPU作為目前最成熟的方案，不能放棄，需要有一批公司扛著，來(lái)正面剛；而存算屬于包抄穿插進(jìn)攻，打破國(guó)外技術(shù)壁壘，實(shí)現(xiàn)新技術(shù)的換道超車。

防御進(jìn)攻都有了，量子計(jì)算還能做什么？

按照上述所說(shuō)，大模型算力之爭(zhēng)，短期看GPU自研，中期看存算、Chiplet，那么被投資人視為新計(jì)算方向的量子計(jì)算在其中又能扮演什么角色？

事實(shí)上，VC對(duì)量子計(jì)算的關(guān)注不只限于此次ChatGPT的熱潮，AR/VR、5G等新應(yīng)用場(chǎng)景的不斷涌現(xiàn)，以及各類型的應(yīng)用場(chǎng)景爆發(fā)式增長(zhǎng)，讓市場(chǎng)對(duì)算力的需求水漲船高，產(chǎn)業(yè)亟待挖掘具有顛覆性的計(jì)算形式。

量子計(jì)算作為一種新型架構(gòu)的計(jì)算，可以實(shí)現(xiàn)指數(shù)級(jí)算力提升，更可謂是不得不關(guān)注的焦點(diǎn)。

據(jù)企查查數(shù)據(jù)顯示，2017年至今，國(guó)內(nèi)量子計(jì)算賽道共完成31起融資事件，公開(kāi)披露融資金額超25億元，融資主要發(fā)生在2021年及以后，占比近7成。其中圖靈量子、本源量子、量旋科技、玻色量子、國(guó)儀量子等在近年獲多輪融資。

對(duì)于這一疑問(wèn)，量旋科技CEO項(xiàng)金根對(duì)量子計(jì)算跟經(jīng)典計(jì)算機(jī)的算力差距，給出了飛機(jī)和地面交通工具的比喻。

他表示，當(dāng)下存算、光芯片、其他一些封裝的改進(jìn)技術(shù)，本質(zhì)上還是經(jīng)典計(jì)算機(jī)的范疇，它運(yùn)算的原理跟GPU本質(zhì)上沒(méi)有太大改變，更多是在傳統(tǒng)的框架下做的一些改進(jìn)，使得人工智能的芯片效率更高。

對(duì)于現(xiàn)有的AI芯片、存算一體或其他封裝技術(shù)對(duì)AI算力的提升，項(xiàng)金根表示認(rèn)可，同時(shí)他也認(rèn)為需要不同維度去看不同解決方案對(duì)算力的助力，這里面不一定存在最優(yōu)解。

“未來(lái)，量子計(jì)算機(jī)肯定能夠助力人工智能。AI需要的算力會(huì)越來(lái)越多，到 2030 年左右可能不光是算力，連耗電量都是非?？植赖臄?shù)據(jù)級(jí)。所以要真正解決AI大規(guī)模的算力需求，量子計(jì)算機(jī)是一個(gè)很有潛力的應(yīng)用方向，而且量子計(jì)算機(jī)的運(yùn)算模式跟人工智能有天然的貼合性，量子計(jì)算機(jī)可以加速AI的一些應(yīng)用場(chǎng)景，而AI亦可以加速量子計(jì)算的研發(fā)，優(yōu)化其操控精度?！?/p>

那么，如此具有革命性的量子計(jì)算何時(shí)能應(yīng)用到AI領(lǐng)域？項(xiàng)金根認(rèn)為，到2030年行業(yè)發(fā)展順利進(jìn)入容錯(cuò)量子計(jì)算階段，將可能是一個(gè)落地的時(shí)間點(diǎn)。

相較于項(xiàng)金根給出的10年之約，俞悅認(rèn)為量子計(jì)算相關(guān)算法在一些行業(yè)特定任務(wù)上的嘗試落地，在這個(gè)時(shí)間點(diǎn)可能會(huì)有一些結(jié)果，至于解決AI的通用任務(wù)上，他則相對(duì)保守地給出了“50年”的看法。甚至投了圖靈量子的聯(lián)想創(chuàng)投也表示，量子計(jì)算從產(chǎn)業(yè)化的角度看，仍挑戰(zhàn)諸多，充滿機(jī)遇。

聯(lián)想創(chuàng)投坦言，量子計(jì)算落地需要解決百萬(wàn)量子比特操縱能力、低環(huán)境要求、高集成度等核心問(wèn)題，具有較高的入局門檻，其產(chǎn)業(yè)化仍面臨技術(shù)路徑不確定、人才儲(chǔ)備稀缺、產(chǎn)業(yè)鏈配套早期以及無(wú)法用傳統(tǒng)的邏輯、電路思維進(jìn)行推導(dǎo)和復(fù)刻的四大痛點(diǎn)。

如此看來(lái)，這些問(wèn)題待解之下，量子計(jì)算就略微顯得理想豐滿、現(xiàn)實(shí)骨感。

此外，俞悅還指出，從邏輯上說(shuō)，量子計(jì)算肯定能解決很多算力問(wèn)題，但即便如此，還需要結(jié)合成本，才能知道量子計(jì)算是不是一個(gè)從投入產(chǎn)出看的最佳方案。

在俞悅看來(lái)，眼下量子計(jì)算行業(yè)還未發(fā)生一些根本性的變化進(jìn)展，中短期與其寄希望于其他方案來(lái)解決大模型所遇到的算力問(wèn)題，不如指望GPU這些經(jīng)典計(jì)算的硬件價(jià)格能下來(lái)。

“解決算力的成本肯定會(huì)越來(lái)越便宜，GPU價(jià)格對(duì)于大模型玩家來(lái)說(shuō)只是暫時(shí)的，終究不會(huì)對(duì)AI發(fā)展構(gòu)成太大瓶頸。而其他方案的成熟還需要很多配套的軟件生態(tài)匹配，相對(duì)來(lái)說(shuō)更是一個(gè)非常長(zhǎng)周期的事情?！?/p>

關(guān)鍵詞：

小说区亚洲自拍另类_91啪在线观看国产_2023年国漫在线观看免费_久久久久久久av_国产AV人人夜夜澡人人爽

資訊

行業(yè)

產(chǎn)業(yè)

產(chǎn)品

技術(shù)

服務(wù)

關(guān)注

供求

品牌

展覽

關(guān)注

國(guó)產(chǎn)GPU：以量取勝

GPU“防守”，存算“包抄”

防御進(jìn)攻都有了，量子計(jì)算還能做什么？

推薦內(nèi)容

關(guān)注

國(guó)產(chǎn)GPU：以量取勝

GPU“防守”，存算“包抄”

防御進(jìn)攻都有了，量子計(jì)算還能做什么？

推薦內(nèi)容

GPU“防守”，存算“包抄”

防御進(jìn)攻都有了，量子計(jì)算還能做什么？