日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

國產(chǎn)替代狂奔,中國版英偉達(dá)何時現(xiàn)身?

2023-07-11 13:28:50來源:ZAKER科技  

導(dǎo)語:在國產(chǎn) GPU 突圍的道路上,部分廠商已經(jīng)走出了自己的路。但鑒于硬件、生態(tài)等各方面的差距,這樣必定是一條充滿荊棘的長路。

最近,風(fēng)頭正盛的英偉達(dá)在算力領(lǐng)域又下一城。

在最新的最新 MLPerf 訓(xùn)練基準(zhǔn)測試中,英偉達(dá)的 H100 僅用 11 分鐘就訓(xùn)練完了 GPT-3。

并且還在所有的八項(xiàng)測試中都創(chuàng)下了新紀(jì)錄。


(資料圖片)

可以說,這是一款專為 AI、HPC 和數(shù)據(jù)分析而設(shè)計的 " 性能怪獸 "。

憑借著 4nm 制程、800 億個晶體管、18432 個 CUDA 核心,以及專用的 Transformer 引擎,H100 將大模型訓(xùn)練速度提高了 6 倍。

同時,H100 還支持 NVLink Switch 系統(tǒng),可以實(shí)現(xiàn)單節(jié)點(diǎn)內(nèi)和節(jié)點(diǎn)間的全方位 GPU 通信,從而支持百億億級(Exascale)的工作負(fù)載。

這也是其能在 MLPerf 8 項(xiàng)基準(zhǔn)測試中橫掃其他競爭者的重要原因。

在算力愈發(fā)重要的 AIGC 時代,任何能提高模型訓(xùn)練、機(jī)器學(xué)習(xí)的硬件技術(shù),都成了各大 AI 企業(yè)垂涎欲滴的產(chǎn)物。

然而,目前在 GPU 領(lǐng)域,大部分國內(nèi)企業(yè),仍然只能仰賴英偉達(dá)一家的技術(shù)。

在國內(nèi)算力愈發(fā)捉襟見肘,以及國際風(fēng)云變幻的敏感時刻,國內(nèi)的 GPU 廠商,能否奮力追趕,解決這一 " 卡脖子 " 難題,以至于成為下一個 " 英偉達(dá) " 呢?

種子選手的秘密

在目前國內(nèi)一票 GPU 的 " 種子選手 " 中,一家名叫壁仞科技的企業(yè)引起了人們的注意。

原因很簡單,那就是其產(chǎn)品 BR100 不僅創(chuàng)下了全球算力紀(jì)錄,并且宣稱其峰值算力達(dá)到了英偉達(dá) A100 的 3 倍,甚至還能對標(biāo)沒發(fā)售的 H100。

然而,稍微了解過國內(nèi)芯片行業(yè)的人都知道,在芯片領(lǐng)域,國內(nèi)的炒作太多了,徒有其表的例子也太多了。

那么,做出這個 " 媲美英偉達(dá) "GPU 的企業(yè),究竟是什么來頭?其自主研發(fā)的 BR100,是否真的像其宣傳的那樣出色?

要回答這個問題,我們不妨先看看壁仞科技的創(chuàng)始班底,技術(shù)背景究竟如何。

作為一家通用智能芯片設(shè)計研發(fā)商的壁仞科技,成立于 2019 年,團(tuán)隊由國內(nèi)外芯片和云計算領(lǐng)域的專家和研發(fā)人員組成。

其創(chuàng)始人張旭博士,不僅擁有清華大學(xué)和斯坦福大學(xué)的博士學(xué)位,還曾是英偉達(dá)的高級架構(gòu)師,負(fù)責(zé) Volta 架構(gòu)的設(shè)計和開發(fā)。

除此之外, 團(tuán)隊其他成員的技術(shù)身份,也頗為亮眼。

李新榮,聯(lián)席 CEO,曾任 AMD 全球副總裁、中國研發(fā)中心總經(jīng)理,負(fù)責(zé) AMD 大中華區(qū)的研發(fā)建設(shè)和管理工作。

洪洲,CTO,曾在 NVIDIA、S3、華為等工作操刀 GPU 工程項(xiàng)目,擁有超過 30 年的 GPU 領(lǐng)域經(jīng)驗(yàn)。

焦國方,軟件生態(tài)環(huán)境主要負(fù)責(zé)人,曾在高通領(lǐng)導(dǎo)和產(chǎn)品研發(fā)了 5 代 Adreno 移動 GPU 系統(tǒng)架構(gòu)。

這樣的團(tuán)隊背景,決定了壁仞科技的技術(shù)底色。

依據(jù)之前在英偉達(dá)、AMD、高通、商湯科技等知名企業(yè)的研發(fā)經(jīng)驗(yàn)和技術(shù)積累,壁仞科技研發(fā)了自主原創(chuàng)的芯片架構(gòu)——壁立仞。

壁立仞架構(gòu)基于 SIMT(單指令多線程)模型,針對 AI 場景進(jìn)行了專用的優(yōu)化和定制。

其最大的特點(diǎn),就是可以將多個小芯片拼成一個大芯片,每個小芯片只做一部分功能,然后通過高速互連組合成一個大芯片。

這樣可以提高芯片的良率和可靠性,同時降低成本和功耗,實(shí)現(xiàn)更強(qiáng)大的算力和擴(kuò)展性。

這就是壁仞科技所謂的Chiplet的設(shè)計理念。

這種技術(shù)的難點(diǎn)在于如何保證芯片之間的高速通信和協(xié)作,同時避免信號干擾和功耗過高。

因此,如何設(shè)計合適的芯片分割和組合方案,使得每個芯片都能發(fā)揮最大的效能,同時減少電磁干擾和熱耗散,就成了 Chiplet 能否成功的關(guān)鍵。

對此,壁仞科技使用了兩種關(guān)鍵的技術(shù)2.5DCoWoS 和 BLink,來攻克這一難關(guān)。

簡單地說,2.5D CoWoS 技術(shù)是一種把多個芯片堆疊在一起的技術(shù),它利用了一個硅基板作為中介層,縮短了芯片之間的距離,從而提高了信號的傳輸速度和質(zhì)量。

而 BLink 則在中介層上,建立了一個專用的接口,它可以讓多個芯片之間直接傳輸數(shù)據(jù),而不需要經(jīng)過其他的電路或芯片,從而減少了延遲和功耗。

然而,盡管 2.5D CoWoS、BLink 這些技術(shù),讓壁仞科技打造出了算力更強(qiáng)的 BR100,但這些技術(shù),目前在國際上并不罕見,其他 GPU 廠商也有過類似的設(shè)計。

例如,Nvidia 的 A100 和 H100 GPU 都采用了 CoWoS 技術(shù),把 GPU 芯片和 HBM 內(nèi)存堆疊在一起,提高了內(nèi)存帶寬和計算性能。而 Nvidia 還開發(fā)了自己的 NVLink 接口,類似于 BLink 接口,可以讓多個 GPU 之間高速互聯(lián)。

此外,AMD 也有自己的 Infinity Fabric 接口,可以實(shí)現(xiàn)類似的功能。

那既然這是一種 " 大家都能用 " 的技術(shù),那壁仞科技怎么就做到讓 BR100 算力達(dá)到 A100 三倍的呢?而英偉達(dá)真就會坐視著自己被超越了?

其實(shí),這樣的結(jié)果,是二者在不同數(shù)據(jù)格式下的表現(xiàn)所致。

具體來說,BR100 的巨大算力,更多是在矩陣 FP32 數(shù)據(jù)格式下的表現(xiàn)。

一般來說,數(shù)據(jù)格式占用的位數(shù)越多,它的范圍和精度就越高,但是也會消耗更多的空間和電力。

而矩陣 FP32 其實(shí)就是一種特殊的 FP32 數(shù)據(jù)格式,它只用了 19 位來存儲一個浮點(diǎn)數(shù),這樣做的目的是為了讓矩陣 FP32 能夠兼容 Tensor Core 這種專門用于加速矩陣乘法的硬件單元。

矩陣乘法是深度學(xué)習(xí)中最常見和最重要的計算操作之一,所以使用矩陣 FP32 可以大幅提升深度學(xué)習(xí)的性能。

但是,矩陣 FP32 也有一個缺點(diǎn),就是它的精度比向量 FP32 低,也就是說它能表示的浮點(diǎn)數(shù)的范圍和細(xì)節(jié)程度比向量 FP32 小。

這樣就會導(dǎo)致一些誤差和損失,在某些情況下可能會影響模型的質(zhì)量和效果。

因此,矩陣 FP32 和英偉達(dá) A100 的向量 FP32 并不等價,因?yàn)榫仃?FP32 只適用于矩陣乘法這種特定的計算操作,并不能代表 GPU 的整體性能。

生態(tài)之痛

除了技術(shù)方面的較量外,軟件生態(tài)上的壁壘,也是國產(chǎn) GPU 無法忽視的一道屏障。

從某種程度上說,這樣的壁壘比某些具體技術(shù)的難點(diǎn),更難以攻克。

在 GPU 領(lǐng)域,業(yè)界流傳著一種說法:"CUDA 是 Nvidia 最深的護(hù)城河 "。

這是因?yàn)?,早在十幾年前,在業(yè)內(nèi)大部分人都認(rèn)為 GPU 只能處理圖形相關(guān)的計算時,英偉達(dá)就已經(jīng)意識到了 GPU 在 AI 領(lǐng)域的潛力和價值,并開始了相應(yīng)的布局,在 2006 年推出了通用并行計算架構(gòu) CUDA。

在 CUDA 問世前,人們在進(jìn)行各種計算任務(wù)時,用的都是 CPU,而非 GPU。

然而,CPU 雖然具有很強(qiáng)的 " 通用性 ",可以處理各種計算,但是它的速度不夠快,而且核心數(shù)量有限。

而相較之下,只能處理圖形計算的 GPU,不僅速度很快快,而且有很多很多的核心。

通過 CUDA,在進(jìn)行 AI 計算時,人們可以將神經(jīng)元之間的計算分配到 GPU 的不同核心上,并行地進(jìn)行運(yùn)算。這樣就大大提高了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和推理的速度、效果。

英偉達(dá)看到了 CUDA 的巨大潛力,于是不斷地完善和優(yōu)化 CUDA 的技術(shù)和生態(tài)。

例如讓 CUDA 支持 C、C++、Fortran、Python 等多種編程語言,或是提供了針對不同領(lǐng)域和應(yīng)用優(yōu)化的庫和工具,比如圖像處理庫、深度學(xué)習(xí)庫、自動駕駛庫等等。

這樣的優(yōu)化,為開發(fā)者提供了極大的便利,使其不用再學(xué)習(xí)新的編程語言,或是從頭開始編寫代碼。

于是,越來越多的人用慣了,用舒服了,CUDA 的生態(tài)就這么被搭建起來了。

誠然,在 CUDA 構(gòu)建自身生態(tài)壁壘的過程中,也不是沒有遇到過競爭者,但最后這些對手都一一成為了 " 陪跑者 "。

例如,蘋果公司和 Khronos Group 在 2009 年推出的 OpenCL,也有過想成為行業(yè)標(biāo)準(zhǔn)的想法,讓人們可以用不同廠商的 CPU、GPU、來做異構(gòu)計算。

然而,OpenCL 沒有 CUDA 那么高效和靈活,需要更多的編程技巧和優(yōu)化工作,這就加大了開發(fā)者的負(fù)擔(dān)。

而英偉達(dá)的老對手 AMD,也想要提供一個通用并行計算平臺,并推出了相應(yīng)的產(chǎn)品 ROCm,它跟 CUDA 的架構(gòu)非常類似,甚至有一個工具叫 hipify,可以把 CUDA 代碼轉(zhuǎn)換成 ROCm 代碼。

但是 ROCm 只能用在 AMD 的 GPU 上,而且只支持幾款顯卡。

于是,綜合對比下來,更多的開發(fā)者還是選擇了 " 通用性 "、" 易用性 " 都更勝一籌的 CUDA。

如今,在軟件生態(tài)方面,壁仞科技也推出了自主研發(fā)的 BIRENSUPA 軟件平臺,試圖通過 " 無縫運(yùn)行 " 的方式,讓開發(fā)者無需修改代碼,就可以在 BR100 系列產(chǎn)品上運(yùn)行原本基于 CUDA 的應(yīng)用。

這樣,習(xí)慣了使用 CUDA 的用戶,如果轉(zhuǎn)而使用 BR100 系列產(chǎn)品,可以獲得更高的計算性能和更低的功耗成本。

然而,這樣的思路,卻面臨著幾大挑戰(zhàn),而其中之一,就是 BR100 系列產(chǎn)品在通用計算生態(tài)上的支持。

BIRENSUPA 軟件平臺

因?yàn)椋谪鹂萍紴榱颂岣?BR100 系列產(chǎn)品在 AI 計算方面的性能和能效,也對流處理器進(jìn)行了一些優(yōu)化和定制,比如說使用 BF16 替代 FP16 作為主要的數(shù)據(jù)格式,以及增加了一些針對 AI 的硬件指令和功能。

這樣,BR100 就可能犧牲了部分通用計算能力,導(dǎo)致其在一些非 AI 的應(yīng)用場景和領(lǐng)域上表現(xiàn)不佳或者不兼容。

而這也是為什么,BR100 的主要應(yīng)用場景,大多是復(fù)旦大學(xué)、清華大學(xué)這類高校的人工智能計算和高性能計算項(xiàng)目。

除此之外,BR100 系列產(chǎn)品,在算力利用率上也存在著風(fēng)險。

雖然,BR100 的架構(gòu)是通用的,如果如果壁仞科技愿意,也同樣可以將其用于通用類的計算。

但因?yàn)?BR100 的內(nèi)部算力帶寬已經(jīng)明顯超過 PCIe 和 HBM2e 的帶寬,所以絕大部分?jǐn)?shù)據(jù)可能都要在 GPU 內(nèi)流轉(zhuǎn)。

這就意味著,雖然 BR100 的算力很強(qiáng)大,它的數(shù)據(jù)來源和輸出通道,都不夠快,不能及時地給它送來或者拿走數(shù)據(jù)。

而如果一個軟件生態(tài)主要支持通用處理, 它的 GPU 芯片往往就需要有足夠高的外部帶寬,來獲取各種類型的數(shù)據(jù)。

這是因?yàn)?,不同類型的?yīng)用,往往對帶寬的需求和敏感度都不同。一些大型的應(yīng)用,可能需要更高的帶寬,才能更好地計算。

最后,也是最具風(fēng)險的一點(diǎn),就是雖然壁仞科技宣稱,BR100 要無縫地支持 CUDA 生態(tài),但 CUDA 不是一個開源生態(tài),英偉達(dá)在其中埋下了大量專利壁壘。

如果壁仞科技真的打算撬動這塊壁壘,則很可能受到英偉達(dá)的在專利上的反擊。

綜上所述,雖然目前在國產(chǎn) GPU 突圍的道路上,部分廠商已經(jīng)走出了自己的路,但鑒于硬件、生態(tài)等各方面的差距,這樣的道路,必定是一條充滿荊棘的長路。

關(guān)鍵詞:

責(zé)任編輯:hnmd003

相關(guān)閱讀

相關(guān)閱讀

精彩推送

推薦閱讀

欧美一区二区性| 永久免费精品视频| 国产成人久久精品麻豆二区| 日韩黄色免费电影| 欧美视频二区欧美影视| 精品久久久亚洲| 亚洲免费婷婷| 色综合视频一区二区三区44| 亚洲aaa级| 欧美日韩国产一区二区三区不卡| 爱啪啪综合导航| 国内精品美女在线观看| 精品少妇一区| 色婷婷亚洲mv天堂mv在影片| 免费视频一区| 精品视频99| 国产精品久久久久久影院8一贰佰| 一区二区日韩免费看| 美女国产精品久久久| 亚洲精品网址| 久久69成人| 荡女精品导航| 国模精品视频| 色综合综合色| 欧美专区18| 国产精品va| 在线看片不卡| 日韩专区中文字幕一区二区| 精品久久97| 日韩影院二区| 久久99精品久久久野外观看| 亚洲中字在线| 国产高清日韩| 久久午夜影视| www久久久| 国产一区二区精品| 国内一区二区三区| 91成人看片| 综合激情在线| 三级在线观看一区二区| 永久亚洲成a人片777777| 欧美日韩第一| 一区二区中文| 免费在线观看视频一区| 日韩电影在线观看电影| 波多野一区二区| 粉嫩久久久久久久极品| 久久天堂av| 久久中文字幕av| 老司机免费视频一区二区三区| 蜜臀91精品国产高清在线观看| 亚洲国产日韩在线| 另类av一区二区| 欧美猛男同性videos| 男人的天堂亚洲一区| 日韩av电影一区| 精品国模一区二区三区| 亚洲天堂黄色| 欧美激情亚洲| 国产精品二区不卡| 欧美视频亚洲视频| 三级成人在线视频| 丝袜亚洲另类欧美综合| 视频精品国内| 久久伊人亚洲| 蜜桃av噜噜一区二区三区小说| 亚洲成人黄色| 日本中文字幕不卡| 青青草视频一区| 合欧美一区二区三区| 亚洲欧洲一二区| 国模套图日韩精品一区二区| 88久久精品| 久久精品理论片| 国产亚洲在线| 精品久久久久久久久久久下田 | 久久国产高清| 成人午夜网址| 亚洲区国产区| 91麻豆精品国产91久久久平台| 欧美黄色影院| 99热这里有精品| 日韩在线理论| 午夜精品亚洲| 91精品国产自产精品男人的天堂| 99精品视频免费| 日本久久黄色| 久久久久一区| 亚洲免费福利一区| 欧美在线日韩| 韩日毛片在线观看| 亚洲视频1区| 欧美日韩一本| 国产在线日韩精品| 日日摸夜夜添夜夜添亚洲女人| 国产精品13p| 99国产精品99久久久久久粉嫩| 一区中文字幕| 国产成人一区二区三区影院| av久久网站| av资源中文在线| 很黄很黄激情成人| 极品国产人妖chinesets亚洲人妖| 国产精品a久久久久| 国产一区 二区| 国产精品成人a在线观看| 91精品高清| 久久精品91| 丁香婷婷成人| 天堂av一区二区三区在线播放| 麻豆视频观看网址久久| 欧洲亚洲精品| 日韩欧美电影| 91免费精品| 蜜臀av在线播放一区二区三区| 亚洲激情婷婷| 不卡在线一区| 欧美一区二区麻豆红桃视频 | 噜噜噜久久亚洲精品国产品小说| 久久理论电影| 久久精品国产99久久| 国产精品久久久网站| 日韩欧美激情电影| 国产一区二区三区探花| 欧美视频三区| 国产欧美亚洲精品a| 久久久久久久久久久久久久久久久久久久| 不卡亚洲精品| 日韩毛片网站| 老司机精品视频网| 成人一区视频| 亚洲精品伦理| 国产精品亚洲欧美| 久久精品国产亚洲高清剧情介绍 | 国产成人黄色| 久久不见久久见免费视频7| 国产不卡av一区二区| 亚洲精品白浆高清| 婷婷精品在线观看| 日韩电影免费在线看| 亚洲a级精品| 日韩影视高清在线观看| 免费精品一区二区三区在线观看| 人人爱人人干婷婷丁香亚洲| 欧美视频一区| 久久裸体视频| 国产一在线精品一区在线观看| 91精品天堂福利在线观看| 久久久蜜桃一区二区人| 欧美va天堂| 国产精品日韩欧美一区| 色综合咪咪久久网| 免费看av不卡| 久久91超碰青草在哪里看| 亚洲狼人精品一区二区三区| 国产乱码精品一区二区亚洲| 亚洲亚洲免费| 成人午夜网址| 欧美成人高清| 国产精品毛片在线| 深夜福利视频一区二区| 成人午夜sm精品久久久久久久| 美女视频一区二区| av在线亚洲一区| 精品视频一区二区三区在线观看| 精品国产欧美日韩| 黑人一区二区| 日韩欧美一区免费| 国内精品久久久久久久影视麻豆| 久久99性xxx老妇胖精品| 噜噜噜狠狠夜夜躁精品仙踪林| 午夜片欧美伦| 国产免费拔擦拔擦8x高清在线人| 欧美极品在线| 欧美猛男同性videos| 国产99亚洲| 日本久久一二三四| 日韩精品国产精品| 精品国产亚洲一区二区在线观看 | 午夜av一区| 日韩激情图片| 中文在线播放一区二区| 国产在线播放精品| 午夜亚洲伦理| 日日夜夜免费精品| 久久九九精品视频| 欧美大片专区| 亚洲人成午夜免电影费观看| 久久精品五月| av动漫精品一区二区| 日韩午夜av在线| 99久久婷婷国产综合精品首页| 亚洲一区二区小说| 久久精品福利| 国产精品原创| 国产一区二区三区免费观看在线| 蜜臀av一区| av在线视屏| 超碰国产精品一区二页| 欧美91精品|