國產(chǎn)大模型，也分「武當(dāng)」和「少林」

2023-07-10 10:11:27來源：ZAKER科技

國產(chǎn)大模型，WAIC（世界人工智能大會(huì)）來了半壁江山。

【資料圖】

這也是 ChatGPT 技驚四座大半年后，30 多個(gè)國產(chǎn)大模型第一次在同一個(gè)舞臺(tái)上，接受不同背景參會(huì)者的審視。

能明顯感受到，相較于半年前效仿 OpenAI 大煉通用語言模型的熱潮，如今 WAIC 呈現(xiàn)出的國產(chǎn)大模型圖景，已經(jīng)大致分為 " 增值派 " 和 " 聚焦派 " 兩大路徑。

所謂的 " 增值派 "，指的是不僅研發(fā)通用大模型基座，還基于基座提供模型 API、算力、訓(xùn)練、部署等配套服務(wù)的廠商，典型案例是推出 MaaS（Model as a Service）平臺(tái)、攜 " 通用大模型、行業(yè)大模型、云、芯片 " 等全家桶到場(chǎng)的云廠商們。

帶著全套模型服務(wù)方案入場(chǎng)的大廠們

而 " 聚焦派 " 則恰恰相反，找準(zhǔn)少量應(yīng)用場(chǎng)景深挖，推出垂直領(lǐng)域的大模型，是他們的策略。這些廠商往往是資源能力和服務(wù)范圍有限的創(chuàng)企，比如聚焦在金融等四個(gè)領(lǐng)域的瀾舟科技，或者是原有業(yè)務(wù)的應(yīng)用場(chǎng)景十分聚焦。

這兩天被不少學(xué)生和家長圍觀的網(wǎng)易有道則是后者的典型案例。他們?cè)诮逃I(lǐng)域推出的 " 子曰 " 大語言模型，參數(shù)規(guī)模為 200 億，在一眾動(dòng)輒上千億的通用大模型中并不算大。

基于網(wǎng)易有道 " 子曰 " 大模型的虛擬人口語教練。

即便派系分化，但對(duì)大模型感到 " 臉盲 "，仍是不少觀展者給 36 氪的反饋：不同廠商呈現(xiàn)出的大模型能力和服務(wù)體系大同小異—— " 增值派 " 廠商將大模型和云、部署等服務(wù)打包售賣，" 聚焦派 " 廠商則是兩手抓：一邊賣行業(yè)模型服務(wù)，一邊賣自身被 AI 升級(jí)后的應(yīng)用。

" 逛了一圈大模型，感覺都差不多，沒有留下太深的印象。" 一名 7 月 6 日開幕當(dāng)天就蹲守在的電器公司銷售經(jīng)理，背著上司 " 改造公司 OA 系統(tǒng) " 的指標(biāo)來到 WAIC，但現(xiàn)實(shí)與理想仍有差距。

有 ChatGPT 珠玉在前，多數(shù)廠商背負(fù)了不小壓力。即便在部分任務(wù)的表現(xiàn)能力能與 GPT-4 掰手腕，但大部分廠商都承認(rèn)，通用大模型的表現(xiàn)與目前賽道的 " 天花板 "GPT-4，依然存在不小差距。

好與壞，難判斷

數(shù)十家大模型企業(yè)，上百款產(chǎn)品，怎么合作？如何落地？不少參會(huì)者迷失在巨大的上海 WAIC 展館里。

對(duì)大模型判斷失準(zhǔn)，癥結(jié)首先出在難以統(tǒng)一的模型能力評(píng)判標(biāo)準(zhǔn)上。

曠視科技多次在公開采訪中表示，會(huì)持續(xù)在大模型技術(shù)方向進(jìn)行投入。曠視 CTO 唐文斌告訴 36 氪，模型的測(cè)評(píng)分為學(xué)術(shù)和業(yè)務(wù)兩個(gè)標(biāo)準(zhǔn)，更易證明的是前者，但對(duì)落地最有價(jià)值的在于后者。

若是讓曠視站在客戶的角度選模型合作方，一定得在實(shí)際業(yè)務(wù)中長期跑起來后，結(jié)合 ROI、效益等指標(biāo)綜合評(píng)判，" 應(yīng)用價(jià)值是檢驗(yàn)大模型能力的最好標(biāo)準(zhǔn) "。

" 學(xué)術(shù)和工程之間隔著鴻溝。" 第四范式聯(lián)合創(chuàng)始人、首席架構(gòu)師胡時(shí)偉說，模型的算法、參數(shù)都是學(xué)術(shù) " 肌肉 "，但能不能給客戶解決實(shí)際問題，需要考驗(yàn)?zāi)Ｐ蛷S商本身對(duì)具體行業(yè)、具體業(yè)務(wù)的認(rèn)知。模型的實(shí)用價(jià)值并非是靜態(tài)、單維的。

他直言 WAIC 不是一個(gè)拉客戶的場(chǎng)合：" 這里你怎么在短時(shí)間內(nèi)給客戶證明模型的業(yè)務(wù)價(jià)值？"

大模型讓人臉盲的另一個(gè)現(xiàn)實(shí)原因則在于，目前不同廠商的模型能力仍然沒有拉開差距，尤其是通用大模型與 GPT-4 存在明顯差距。

一個(gè)典型的例子是，對(duì)于 C 端應(yīng)用場(chǎng)景明晰且有數(shù)據(jù)積累的有道而言，在通用大模型的基礎(chǔ)上精調(diào)是捷徑，但有道依然選擇了自訓(xùn) " 子曰 " 大模型的荊棘路。" 國產(chǎn)通用大模型的能力滿足不了垂直場(chǎng)景需求 " 就是有道的工作人員給 36 氪列舉的其中一個(gè)原因。

沿著 Transformer 的訓(xùn)練路徑，目前 GPT-4 就是面世模型中的能力天花板，也給國內(nèi)廠商提供了行之有效的技術(shù)路線參考。但在今年 3 月 36 氪的專訪中，百度 CEO 李彥宏認(rèn)為創(chuàng)企做類似 ChatGPT 的大語言模型是 " 重復(fù)造輪子 "：" 創(chuàng)業(yè)公司重新做一個(gè) ChatGPT 其實(shí)沒有多大意義。"

" 這個(gè)階段國內(nèi)大部分廠商只能做重復(fù)造輪子的工作。" 面壁智能聯(lián)合創(chuàng)始人兼 CTO 曾國洋對(duì) 36 氪說道，"GPT-4 也被證明與 AGI（通用人工智能）有差距，但國內(nèi)公司先得追上 GPT-4，才有資格開始造車。"

在他看來，造輪子不等于沒意義，而是在模型發(fā)展初期需要做的 "Dirty Work"。曾國洋打了個(gè)比方，就像學(xué)數(shù)學(xué)，現(xiàn)階段廠商是洗數(shù)據(jù)、堆參數(shù)、調(diào)試代碼的小學(xué)生，需要打好 10 以內(nèi)數(shù)學(xué)運(yùn)算的基礎(chǔ)；等到上了大學(xué)，廠商才有可能去碰線性代數(shù)、微積分等更高維的東西，跳出造輪子的階段去做創(chuàng)新。

用 B 端的生意打磨輪子

現(xiàn)階段，C 端場(chǎng)景的價(jià)值并不大——這是不少模型廠商的共識(shí)。

真金得用火煉，但不少 C 端場(chǎng)景都不夠復(fù)雜，對(duì)模型能力的打磨效果不顯著。" 用模型直接做 toC 應(yīng)用，滿足的基本是生成功能，這是一個(gè)交付流程很短的場(chǎng)景。" 商湯的工作人員對(duì) 36 氪表示。

再者，即便 C 端能帶來大量的用戶反饋數(shù)據(jù)，但企業(yè)還需面對(duì) " 多數(shù)據(jù)、低質(zhì)量 " 的問題。一名網(wǎng)易有道的工作人員告訴 36 氪，訓(xùn)練 " 子曰 " 最可用的數(shù)據(jù)來自于試題和標(biāo)準(zhǔn)答案，靠用戶反饋的數(shù)據(jù)依然需要大量的人工清洗和標(biāo)注。

因此，靠 B 端業(yè)務(wù)獲得營收，并在業(yè)務(wù)場(chǎng)景中用較高質(zhì)量數(shù)據(jù)資源提高工程能力，是不少模型廠商如今的發(fā)力點(diǎn)。

極少公開露面的 AI" 當(dāng)紅炸子雞 "MiniMax，這次特地來為合作方金山辦公站了臺(tái)，順勢(shì)推出了自研通用大模型 Abab 的 5.0 版本。這兩家公司在今年 5 月攜手推出了 " 中國版辦公 Copilot" ——自動(dòng)生成 PPT 大綱和模板、PDF 文檔重點(diǎn)提取等熱門功能，在 WPS 的展位大屏上循環(huán)播放。

WPS AI 的功能。圖源：WPS

" 高質(zhì)量的標(biāo)注數(shù)據(jù)，依然是稀缺資源。"MiniMax 技術(shù)總監(jiān)劉啟君對(duì) 36 氪直言。對(duì) 2022 年就儲(chǔ)備了一批顯卡的 MiniMax 而言，算力還不算卡脖子的問題，但想要讓模型能力更上一層，高質(zhì)量的標(biāo)注數(shù)據(jù)必不可少。

為了用最低的成本獲取高質(zhì)量數(shù)據(jù)，和 B 端的頭部廠商合作是 MiniMax 所選的捷徑。劉啟君分析與 WPS 合作的理由：" 一是 WPS 積累的數(shù)據(jù)足夠高質(zhì)，可以直接拿來用；二是 WPS 的業(yè)務(wù)場(chǎng)景涉及圖片、文字識(shí)別、提取、轉(zhuǎn)換等復(fù)雜的場(chǎng)景，可以借此打磨模型能力。"

不過具體到對(duì) B 端場(chǎng)景的選擇，" 增值派 " 和 " 聚焦派 " 選擇的是截然不同的兩條路徑。

" 拿著錘子找釘子 "，即場(chǎng)景的橫向擴(kuò)張，多年來是具有豐富客戶資源、的 " 增值派 " 大廠的標(biāo)配。

"（大廠商）最主要的考量是用大模型業(yè)務(wù)帶動(dòng)大廠的其他業(yè)務(wù)，比如云、芯片。" 一名參加展會(huì)的券商告訴 36 氪。比如，對(duì)于 BTA、華為等具有云計(jì)算優(yōu)勢(shì)的廠商而言，將通用大模型的 API 服務(wù)與云計(jì)算結(jié)合，就能做訓(xùn)練、微調(diào)和部署等端到端的好生意。

不過，捆綁銷售的策略也意味著 " 增值派 " 的服務(wù)對(duì)象往往是本身具有雄厚經(jīng)濟(jì)實(shí)力的政府和國央企——客戶只需拿出數(shù)據(jù)，企業(yè)就能提供模型精調(diào)、部署等全套服務(wù)。36 氪從阿里云工作人員和多個(gè)咨詢客戶的口中了解到，通義千問的私有化部署方案，目前給出的參考價(jià)格高達(dá)百萬、甚至千萬元一年。

與之相對(duì)的，" 聚焦派 " 則往往從 B 端企業(yè)的細(xì)分需求切入，除了能在較短時(shí)間內(nèi)創(chuàng)收，也能與相繼發(fā)布通用模型的 BTA 等云廠商打差異化策略。

比如第四范式和瀾舟科技布局的重點(diǎn)，往往都延續(xù)了之前就有客戶積累和工程經(jīng)驗(yàn)的 B 端場(chǎng)景。第四范式這次 WAIC 帶來了 " 式說 " 大模型的一些行業(yè)進(jìn)展，其中一個(gè)行業(yè)案例是與一家零售企業(yè)的合作，此前，決策類的 AI 技術(shù)已經(jīng)被廣泛應(yīng)用在電子菜單推薦系統(tǒng)的開發(fā)，如今基于大模型的生成式 AI，開始逐漸被應(yīng)用于對(duì)門店管理系統(tǒng)的改造。

在談及周圍 " 廠均 " 拋出十多個(gè)行業(yè)模型方案，胡時(shí)偉告訴 36 氪，他并不擔(dān)心大廠造成的競爭壓力，因?yàn)橄日业结斪颖饶弥N子更重要：" 我要再次強(qiáng)調(diào)，模型研發(fā)和落地之間有鴻溝。"

而企業(yè)瞄準(zhǔn) B 端發(fā)力的目的，最終是讓造輪子和造車兩條腿一起走起來。

與大部分廠商一樣，MiniMax 仍然有對(duì)標(biāo) OpenAI 的野心。" 我們只做一個(gè)通用大模型基座，不做分開做行業(yè)大模型。" 劉啟君覺得現(xiàn)階段 MiniMax 這樣資源有限的企業(yè)需要集中算力、數(shù)據(jù)和金錢資源辦大事，即提升通用模型的能力。他透露，目前 MiniMax 能夠按周迭代模型能力。

7 月 6 日的 WAIC 開幕式上，" 深度學(xué)習(xí)之父 " 楊立昆重申 "LLM 不會(huì)是那條通往人類智能的道路 "。這也讓許多廠商嘗試跳脫出 Transformer 的框架，去做創(chuàng)新。" 做創(chuàng)新性的研究，包括和學(xué)界合作是國內(nèi)廠商今年開始很重要的命題。" 胡時(shí)偉說。

關(guān)鍵詞：

責(zé)任編輯：hnmd003

國產(chǎn)大模型，也分「武當(dāng)」和「少林」

相關(guān)閱讀

相關(guān)閱讀

精彩推薦

閱讀排行

精彩推送

推薦閱讀