國產(chǎn)大模型,也分「武當(dāng)」和「少林」
國產(chǎn)大模型,WAIC(世界人工智能大會(huì))來了半壁江山。
【資料圖】
這也是 ChatGPT 技驚四座大半年后,30 多個(gè)國產(chǎn)大模型第一次在同一個(gè)舞臺(tái)上,接受不同背景參會(huì)者的審視。
能明顯感受到,相較于半年前效仿 OpenAI 大煉通用語言模型的熱潮,如今 WAIC 呈現(xiàn)出的國產(chǎn)大模型圖景,已經(jīng)大致分為 " 增值派 " 和 " 聚焦派 " 兩大路徑。
所謂的 " 增值派 ",指的是不僅研發(fā)通用大模型基座,還基于基座提供模型 API、算力、訓(xùn)練、部署等配套服務(wù)的廠商,典型案例是推出 MaaS(Model as a Service)平臺(tái)、攜 " 通用大模型、行業(yè)大模型、云、芯片 " 等全家桶到場(chǎng)的云廠商們。
帶著全套模型服務(wù)方案入場(chǎng)的大廠們而 " 聚焦派 " 則恰恰相反,找準(zhǔn)少量應(yīng)用場(chǎng)景深挖,推出垂直領(lǐng)域的大模型,是他們的策略。這些廠商往往是資源能力和服務(wù)范圍有限的創(chuàng)企,比如聚焦在金融等四個(gè)領(lǐng)域的瀾舟科技,或者是原有業(yè)務(wù)的應(yīng)用場(chǎng)景十分聚焦。
這兩天被不少學(xué)生和家長圍觀的網(wǎng)易有道則是后者的典型案例。他們?cè)诮逃I(lǐng)域推出的 " 子曰 " 大語言模型,參數(shù)規(guī)模為 200 億,在一眾動(dòng)輒上千億的通用大模型中并不算大。
基于網(wǎng)易有道 " 子曰 " 大模型的虛擬人口語教練。即便派系分化,但對(duì)大模型感到 " 臉盲 ",仍是不少觀展者給 36 氪的反饋:不同廠商呈現(xiàn)出的大模型能力和服務(wù)體系大同小異—— " 增值派 " 廠商將大模型和云、部署等服務(wù)打包售賣," 聚焦派 " 廠商則是兩手抓:一邊賣行業(yè)模型服務(wù),一邊賣自身被 AI 升級(jí)后的應(yīng)用。
" 逛了一圈大模型,感覺都差不多,沒有留下太深的印象。" 一名 7 月 6 日開幕當(dāng)天就蹲守在的電器公司銷售經(jīng)理,背著上司 " 改造公司 OA 系統(tǒng) " 的指標(biāo)來到 WAIC,但現(xiàn)實(shí)與理想仍有差距。
有 ChatGPT 珠玉在前,多數(shù)廠商背負(fù)了不小壓力。即便在部分任務(wù)的表現(xiàn)能力能與 GPT-4 掰手腕,但大部分廠商都承認(rèn),通用大模型的表現(xiàn)與目前賽道的 " 天花板 "GPT-4,依然存在不小差距。
好與壞,難判斷
數(shù)十家大模型企業(yè),上百款產(chǎn)品,怎么合作?如何落地?不少參會(huì)者迷失在巨大的上海 WAIC 展館里。
對(duì)大模型判斷失準(zhǔn),癥結(jié)首先出在難以統(tǒng)一的模型能力評(píng)判標(biāo)準(zhǔn)上。
曠視科技多次在公開采訪中表示,會(huì)持續(xù)在大模型技術(shù)方向進(jìn)行投入。曠視 CTO 唐文斌告訴 36 氪,模型的測(cè)評(píng)分為學(xué)術(shù)和業(yè)務(wù)兩個(gè)標(biāo)準(zhǔn),更易證明的是前者,但對(duì)落地最有價(jià)值的在于后者。
若是讓曠視站在客戶的角度選模型合作方,一定得在實(shí)際業(yè)務(wù)中長期跑起來后,結(jié)合 ROI、效益等指標(biāo)綜合評(píng)判," 應(yīng)用價(jià)值是檢驗(yàn)大模型能力的最好標(biāo)準(zhǔn) "。
" 學(xué)術(shù)和工程之間隔著鴻溝。" 第四范式聯(lián)合創(chuàng)始人、首席架構(gòu)師胡時(shí)偉說,模型的算法、參數(shù)都是學(xué)術(shù) " 肌肉 ",但能不能給客戶解決實(shí)際問題,需要考驗(yàn)?zāi)P蛷S商本身對(duì)具體行業(yè)、具體業(yè)務(wù)的認(rèn)知。模型的實(shí)用價(jià)值并非是靜態(tài)、單維的。
他直言 WAIC 不是一個(gè)拉客戶的場(chǎng)合:" 這里你怎么在短時(shí)間內(nèi)給客戶證明模型的業(yè)務(wù)價(jià)值?"
大模型讓人臉盲的另一個(gè)現(xiàn)實(shí)原因則在于,目前不同廠商的模型能力仍然沒有拉開差距,尤其是通用大模型與 GPT-4 存在明顯差距。
一個(gè)典型的例子是,對(duì)于 C 端應(yīng)用場(chǎng)景明晰且有數(shù)據(jù)積累的有道而言,在通用大模型的基礎(chǔ)上精調(diào)是捷徑,但有道依然選擇了自訓(xùn) " 子曰 " 大模型的荊棘路。" 國產(chǎn)通用大模型的能力滿足不了垂直場(chǎng)景需求 " 就是有道的工作人員給 36 氪列舉的其中一個(gè)原因。
沿著 Transformer 的訓(xùn)練路徑,目前 GPT-4 就是面世模型中的能力天花板,也給國內(nèi)廠商提供了行之有效的技術(shù)路線參考。但在今年 3 月 36 氪的專訪中,百度 CEO 李彥宏認(rèn)為創(chuàng)企做類似 ChatGPT 的大語言模型是 " 重復(fù)造輪子 ":" 創(chuàng)業(yè)公司重新做一個(gè) ChatGPT 其實(shí)沒有多大意義。"
" 這個(gè)階段國內(nèi)大部分廠商只能做重復(fù)造輪子的工作。" 面壁智能聯(lián)合創(chuàng)始人兼 CTO 曾國洋對(duì) 36 氪說道,"GPT-4 也被證明與 AGI(通用人工智能)有差距,但國內(nèi)公司先得追上 GPT-4,才有資格開始造車。"
在他看來,造輪子不等于沒意義,而是在模型發(fā)展初期需要做的 "Dirty Work"。曾國洋打了個(gè)比方,就像學(xué)數(shù)學(xué),現(xiàn)階段廠商是洗數(shù)據(jù)、堆參數(shù)、調(diào)試代碼的小學(xué)生,需要打好 10 以內(nèi)數(shù)學(xué)運(yùn)算的基礎(chǔ);等到上了大學(xué),廠商才有可能去碰線性代數(shù)、微積分等更高維的東西,跳出造輪子的階段去做創(chuàng)新。
用 B 端的生意打磨輪子
現(xiàn)階段,C 端場(chǎng)景的價(jià)值并不大——這是不少模型廠商的共識(shí)。
真金得用火煉,但不少 C 端場(chǎng)景都不夠復(fù)雜,對(duì)模型能力的打磨效果不顯著。" 用模型直接做 toC 應(yīng)用,滿足的基本是生成功能,這是一個(gè)交付流程很短的場(chǎng)景。" 商湯的工作人員對(duì) 36 氪表示。
再者,即便 C 端能帶來大量的用戶反饋數(shù)據(jù),但企業(yè)還需面對(duì) " 多數(shù)據(jù)、低質(zhì)量 " 的問題。一名網(wǎng)易有道的工作人員告訴 36 氪,訓(xùn)練 " 子曰 " 最可用的數(shù)據(jù)來自于試題和標(biāo)準(zhǔn)答案,靠用戶反饋的數(shù)據(jù)依然需要大量的人工清洗和標(biāo)注。
因此,靠 B 端業(yè)務(wù)獲得營收,并在業(yè)務(wù)場(chǎng)景中用較高質(zhì)量數(shù)據(jù)資源提高工程能力,是不少模型廠商如今的發(fā)力點(diǎn)。
極少公開露面的 AI" 當(dāng)紅炸子雞 "MiniMax,這次特地來為合作方金山辦公站了臺(tái),順勢(shì)推出了自研通用大模型 Abab 的 5.0 版本。這兩家公司在今年 5 月攜手推出了 " 中國版辦公 Copilot" ——自動(dòng)生成 PPT 大綱和模板、PDF 文檔重點(diǎn)提取等熱門功能,在 WPS 的展位大屏上循環(huán)播放。
WPS AI 的功能。圖源:WPS" 高質(zhì)量的標(biāo)注數(shù)據(jù),依然是稀缺資源。"MiniMax 技術(shù)總監(jiān)劉啟君對(duì) 36 氪直言。對(duì) 2022 年就儲(chǔ)備了一批顯卡的 MiniMax 而言,算力還不算卡脖子的問題,但想要讓模型能力更上一層,高質(zhì)量的標(biāo)注數(shù)據(jù)必不可少。
為了用最低的成本獲取高質(zhì)量數(shù)據(jù),和 B 端的頭部廠商合作是 MiniMax 所選的捷徑。劉啟君分析與 WPS 合作的理由:" 一是 WPS 積累的數(shù)據(jù)足夠高質(zhì),可以直接拿來用;二是 WPS 的業(yè)務(wù)場(chǎng)景涉及圖片、文字識(shí)別、提取、轉(zhuǎn)換等復(fù)雜的場(chǎng)景,可以借此打磨模型能力。"
不過具體到對(duì) B 端場(chǎng)景的選擇," 增值派 " 和 " 聚焦派 " 選擇的是截然不同的兩條路徑。
" 拿著錘子找釘子 ",即場(chǎng)景的橫向擴(kuò)張,多年來是具有豐富客戶資源、的 " 增值派 " 大廠的標(biāo)配。
"(大廠商)最主要的考量是用大模型業(yè)務(wù)帶動(dòng)大廠的其他業(yè)務(wù),比如云、芯片。" 一名參加展會(huì)的券商告訴 36 氪。比如,對(duì)于 BTA、華為等具有云計(jì)算優(yōu)勢(shì)的廠商而言,將通用大模型的 API 服務(wù)與云計(jì)算結(jié)合,就能做訓(xùn)練、微調(diào)和部署等端到端的好生意。
不過,捆綁銷售的策略也意味著 " 增值派 " 的服務(wù)對(duì)象往往是本身具有雄厚經(jīng)濟(jì)實(shí)力的政府和國央企——客戶只需拿出數(shù)據(jù),企業(yè)就能提供模型精調(diào)、部署等全套服務(wù)。36 氪從阿里云工作人員和多個(gè)咨詢客戶的口中了解到,通義千問的私有化部署方案,目前給出的參考價(jià)格高達(dá)百萬、甚至千萬元一年。
與之相對(duì)的," 聚焦派 " 則往往從 B 端企業(yè)的細(xì)分需求切入,除了能在較短時(shí)間內(nèi)創(chuàng)收,也能與相繼發(fā)布通用模型的 BTA 等云廠商打差異化策略。
比如第四范式和瀾舟科技布局的重點(diǎn),往往都延續(xù)了之前就有客戶積累和工程經(jīng)驗(yàn)的 B 端場(chǎng)景。第四范式這次 WAIC 帶來了 " 式說 " 大模型的一些行業(yè)進(jìn)展,其中一個(gè)行業(yè)案例是與一家零售企業(yè)的合作,此前,決策類的 AI 技術(shù)已經(jīng)被廣泛應(yīng)用在電子菜單推薦系統(tǒng)的開發(fā),如今基于大模型的生成式 AI,開始逐漸被應(yīng)用于對(duì)門店管理系統(tǒng)的改造。
在談及周圍 " 廠均 " 拋出十多個(gè)行業(yè)模型方案,胡時(shí)偉告訴 36 氪,他并不擔(dān)心大廠造成的競爭壓力,因?yàn)橄日业结斪颖饶弥N子更重要:" 我要再次強(qiáng)調(diào),模型研發(fā)和落地之間有鴻溝。"
而企業(yè)瞄準(zhǔn) B 端發(fā)力的目的,最終是讓造輪子和造車兩條腿一起走起來。
與大部分廠商一樣,MiniMax 仍然有對(duì)標(biāo) OpenAI 的野心。" 我們只做一個(gè)通用大模型基座,不做分開做行業(yè)大模型。" 劉啟君覺得現(xiàn)階段 MiniMax 這樣資源有限的企業(yè)需要集中算力、數(shù)據(jù)和金錢資源辦大事,即提升通用模型的能力。他透露,目前 MiniMax 能夠按周迭代模型能力。
7 月 6 日的 WAIC 開幕式上," 深度學(xué)習(xí)之父 " 楊立昆重申 "LLM 不會(huì)是那條通往人類智能的道路 "。這也讓許多廠商嘗試跳脫出 Transformer 的框架,去做創(chuàng)新。" 做創(chuàng)新性的研究,包括和學(xué)界合作是國內(nèi)廠商今年開始很重要的命題。" 胡時(shí)偉說。
責(zé)任編輯:hnmd003
相關(guān)閱讀
-
Twitter 競品 Threads 注冊(cè)數(shù)突破 7000 萬
品玩7月10日訊,Meta的Twitter競品Threads自上線后,用戶注冊(cè)量持續(xù)激
2023-07-10 -
《流浪地球》導(dǎo)演郭帆: AI 給我威脅,「浪球 3」靈感也來了
作者|鄭玥編輯|靖宇《流浪地球》系列導(dǎo)演郭帆的發(fā)言,讓會(huì)場(chǎng)里響起了一
2023-07-10
相關(guān)閱讀
-
國產(chǎn)大模型,也分「武當(dāng)」和「少林」
國產(chǎn)大模型,WAIC(世界人工智能大會(huì))來了半壁江山。這也是ChatGPT技
-
知乎知錯(cuò)了,下線“匿名功能”
知乎沖上了熱搜第一,宣布將下線匿名功能。完了……難道以后人都飛去美
-
西藏拉薩市開展制止餐飲浪費(fèi)“隨機(jī)查餐廳”行動(dòng)城關(guān)區(qū)1家餐飲店被責(zé)令限期整改
今年4月份,西藏自治區(qū)拉薩市推行制止餐飲浪費(fèi)“紅黑榜”制度,市場(chǎng)監(jiān)
-
國家統(tǒng)計(jì)局:6月份居住價(jià)格環(huán)比上漲0.1%
國家統(tǒng)計(jì)局:6月份居住價(jià)格環(huán)比上漲0 1%環(huán)比方面,居住、醫(yī)療保健價(jià)格
-
販賣續(xù)航焦慮癥 新能源車賣得好 真的就全靠油箱大?
最近車圈的熱門話題真不少,這其中很多話題都和理想有關(guān),作為銷量排名
-
溫州人喜歡去哪里體驗(yàn)夜生活?解鎖夜溫州的5種打開方式
高溫夏夜,越來越多的市民、游客走上街頭體驗(yàn)夜間消費(fèi)。逛夜市、吃美食
-
港股造車新勢(shì)力高開,蔚來汽車漲4.3%,理想汽車漲3%,小鵬汽車漲0.55%。
港股造車新勢(shì)力高開,蔚來汽車漲4 3%,理想汽車漲3%,小鵬汽車漲0 55%
-
CPO概念股震蕩走低 銘普光磁跌超8%
7月10日上午,CPO概念股震蕩走低,銘普光磁跌超8%,東田微跌近6%,兆龍
-
保險(xiǎn)最小年齡是多大?依據(jù)是什么?
保險(xiǎn)的最小年齡限制是指購買或申請(qǐng)保險(xiǎn)時(shí)申請(qǐng)人需要滿足的最低年齡要求
-
寵物保險(xiǎn)有年齡限制嗎?標(biāo)準(zhǔn)是什么?
在寵物保險(xiǎn)領(lǐng)域,確實(shí)存在著一定的年齡限制。不同的寵物保險(xiǎn)公司可能會(huì)
-
農(nóng)村醫(yī)療保險(xiǎn)年齡范圍是什么?報(bào)銷比例是多少?
農(nóng)村醫(yī)療保險(xiǎn)的年齡范圍通常設(shè)定為18歲以上的農(nóng)村居民。這意味著年滿18
-
商業(yè)保險(xiǎn)最大年齡限制是什么?依據(jù)是什么?
商業(yè)保險(xiǎn)的最大年齡限制是指購買或參與商業(yè)保險(xiǎn)計(jì)劃時(shí)所允許的最高年齡
-
養(yǎng)老保險(xiǎn)補(bǔ)繳年齡限制是多少?依據(jù)是什么?
在養(yǎng)老保險(xiǎn)制度中,確實(shí)存在著一定的補(bǔ)繳年齡限制。不同國家和地區(qū)的養(yǎng)
-
?阿里巴巴港股開盤漲超5%,螞蟻集團(tuán)71億罰單落地
截至發(fā)稿,阿里巴巴漲5 52%。據(jù)證監(jiān)會(huì)官網(wǎng)消息,近期,針對(duì)螞蟻集團(tuán)
-
法國財(cái)政部長:希望特斯拉能在法國建廠
法國財(cái)政部長:希望特斯拉能在法國建廠蓋世汽車訊據(jù)外媒報(bào)道,法國財(cái)政
-
促消費(fèi)燃旺煙火氣|一場(chǎng)早市 半城煙火
“四方食事,不過一碗人間煙火。”作家中的“吃貨”汪曾祺酷愛逛菜市。
-
“我為企業(yè)找訂單” 助力企業(yè)發(fā)展
近日,市工信局聯(lián)合九原工業(yè)園區(qū)在內(nèi)蒙古光威碳纖維有限公司召開“我為
-
提前還貸違約金怎么算?提前還貸三大忌
提前還貸違約金怎么算?房貸提前還款,違約金應(yīng)該按照合同約定進(jìn)行計(jì)算。提前還款是否要繳納手續(xù)費(fèi)是看貸...
-
對(duì)于人類來說,多熱才算“太熱”?
人類可安全容忍的溫度極限是多少?6日,英國羅漢普頓大學(xué)研究團(tuán)隊(duì)報(bào)告
-
Twitter 競品 Threads 注冊(cè)數(shù)突破 7000 萬
品玩7月10日訊,Meta的Twitter競品Threads自上線后,用戶注冊(cè)量持續(xù)激
-
別擔(dān)心,AI 還取代不了文娛創(chuàng)作
燃次元(ID:chaintruth)原創(chuàng)作者|陶淘編輯|曹楊A(yù)IGC(人工智能生成
-
見證歷史,就在今天!
首只進(jìn)入退市整理期的可轉(zhuǎn)債今日正式出現(xiàn)。*ST藍(lán)盾最新公告稱,7月10日
-
張?zhí)m敗訴!海外欠債近 10 億?本人回應(yīng):被資本算計(jì)
張?zhí)m與CVCCapitalPartners(以下簡稱CVC)的愛恨情仇出現(xiàn)了新進(jìn)展。今
-
陳思誠主控的電影票房達(dá) 170 億,陳式懸疑財(cái)富密碼在這
圖片來源@視覺中國文|文化產(chǎn)業(yè)評(píng)論,作者|逍遙客,編輯|半島據(jù)貓眼專業(yè)
-
三聯(lián)鍛造(001282.SZ):截至去年底定點(diǎn)開發(fā)的新能源項(xiàng)目已達(dá)45個(gè),其中如電機(jī)空心軸等多款產(chǎn)品已量產(chǎn)
格隆匯7月10日丨有投資者向三聯(lián)鍛造(001282 SZ)提問,“貴公司主營新能
-
明起正式入伏5省份局地達(dá)40℃以上!入伏下雨有什么說法嗎?
明起正式入伏5省份局地達(dá)40℃以上!當(dāng)前高溫?zé)崂顺掷m(xù)席卷北方,氣象部門預(yù)測(cè)2023年或成為歷史上最熱夏季...
-
口腔保健義診走進(jìn)我國海拔最高鄉(xiāng)
近日,上海市徐匯區(qū)牙病防治所的醫(yī)務(wù)工作者來到西藏浪卡子縣普瑪江塘鄉(xiāng)
-
西安至加德滿都國際航線復(fù)航
9日,西藏航空TV6019西安—加德滿都航班從西安起飛,前往尼泊爾,標(biāo)志
-
深入實(shí)施企業(yè)上市“格桑花行動(dòng)”計(jì)劃西藏印發(fā)7方面71條涉企優(yōu)惠政策
近日,西藏自治區(qū)推進(jìn)企業(yè)上市領(lǐng)導(dǎo)小組匯總梳理國家和自治區(qū)企業(yè)上市及
-
露營加入智能屬性,點(diǎn)燃了哪些行業(yè)?
“相比去年露營火爆時(shí)的供不應(yīng)求,今年很明顯更多用戶已經(jīng)回歸理性。”
精彩推薦
- 西藏拉薩市開展制止餐飲浪費(fèi)“隨機(jī)查餐...
- 口腔保健義診走進(jìn)我國海拔最高鄉(xiāng)
- 西安至加德滿都國際航線復(fù)航
- 深入實(shí)施企業(yè)上市“格桑花行動(dòng)”計(jì)劃西...
- 在雪域高原發(fā)光發(fā)熱的人
- 那曲歐瑪亭嘎100兆瓦風(fēng)電項(xiàng)目首臺(tái)機(jī)組吊...
- 喜馬拉雅紀(jì)行丨向云端,扎西次仁和他的背包
- 上海醫(yī)學(xué)專家“一站式”為西藏民眾解憂
- 簽約項(xiàng)目30個(gè) 2023全球數(shù)字經(jīng)濟(jì)大會(huì)拉...
- 西藏:數(shù)字經(jīng)濟(jì)加速融入國家“東數(shù)西算...
閱讀排行
精彩推送
- 錘頭線意味著什么?錘頭線第二天...
- 工商銀行定期存款有風(fēng)險(xiǎn)嗎?為什...
- 張家界在上海舉行“迎老鄉(xiāng)回故鄉(xiāng)...
- 攜手本澤馬?名記:博格巴收到吉...
- 建行信用卡申請(qǐng)后多久審批下來?...
- 個(gè)人創(chuàng)業(yè)貸款能貸多少?個(gè)人創(chuàng)業(yè)...
- 純電能跑110km 啟辰大V DD-i超...
- 青山綠水國畫上身 坦克300藝術(shù)...
- 美元和黃金掛鉤嗎?為什么美元下...
- 券商板塊是哪些股票?券商板塊為...
- 促消費(fèi)燃旺煙火氣|“博物館之夜...
- “警察藍(lán)”守護(hù)盛夏“煙火氣”
- 走近企業(yè)家|鄭彬:讓呦呦鹿鳴擦...
- 我市下達(dá)資金加強(qiáng)高標(biāo)準(zhǔn)農(nóng)田建設(shè)
- 就業(yè)崗位 進(jìn)校園
- 同業(yè)存放屬于什么科目?銀行為什...
- 銀行收益率怎么算收益?銀行收益...
- 銀行倒閉的可能性大嗎?銀行倒閉...
- 獨(dú)居老人沒開空調(diào)致熱痙攣咬斷2...
- 湖北五峰山體滑坡仍有7人失聯(lián)
- 《流浪地球》導(dǎo)演郭帆: AI 給...
- 華為智駕之爭,問界比阿維塔更領(lǐng)...
- Meta 高管稱 Threads 目標(biāo)不是取代推特
- 特斯拉公布最新引薦購車獎(jiǎng)勵(lì)規(guī)則
- 全球郵輪游火爆 今年全球乘郵輪...
- 我愛我家杭州公司內(nèi)部動(dòng)蕩,高管...
- 突然,多名高管被總部停職!
- 大跌眼鏡,京東方好夢(mèng)半年游
- 主辦方辟謠周杰倫演唱會(huì) 10 萬...
- 財(cái)政赤字率什么意思?財(cái)政赤字率...






