全球快看:一家 380 億美元的數(shù)據(jù)巨頭,要掀起企業(yè)「AI 化」革命
作者 | 宛辰、Li Yuan
(資料圖片)
編輯 | 靖宇
當?shù)貢r間 6 月 28 日,美國知名數(shù)據(jù)平臺 Databricks 舉辦了自己的年度大會——數(shù)據(jù)與人工智能峰會。會上,Databricks 公布了 LakehouseIQ、Lakehouse AI、Databricks Marketplace 、 Lakehouse Apps 等一系列重要新品。
無論是從峰會的名稱,還是新產(chǎn)品的命名,都能看出這家知名數(shù)據(jù)平臺,正在趁著大語言模型的東風,加速向 AI 轉(zhuǎn)變的腳步。
Databricks 公司 CEO Ali Ghodsi 所說的數(shù)據(jù)和 AI 普惠化|Databricks「Databricks 要實現(xiàn)的是『數(shù)據(jù)普惠』和 AI 普惠,前者讓數(shù)據(jù)通向每一個雇員,后者讓 AI 進入每一個產(chǎn)品。」Databricks 公司 CEO Ali Ghodsi 在臺上說出了團隊的使命。
就在大會開始之前,Databricks 剛剛宣布以 13 億美元收購 AI 領(lǐng)域的新生力量 MosaicML,創(chuàng)下了當前 AI 領(lǐng)域收購紀錄,可見公司在 AI 轉(zhuǎn)型上的力度和決心。
正在前方參會的 PingCAP 創(chuàng)始人兼 CEO 劉奇告訴極客公園,Databricks 平臺剛剛上線 AI 的企業(yè)級應用,就已經(jīng)有超過 1500 家公司在上面進行模型訓練,「數(shù)字超出預期」。同時,他認為 Databricks 由于之前在數(shù)據(jù) + AI 方面的積累,讓公司能在 AI 大火之際,迅速在之前平臺基礎(chǔ)上加入新產(chǎn)品,就能快速給出和大模型相關(guān)的服務。
「最關(guān)鍵的就是速度。」劉奇說道,在大模型時代,如何用更快的速度讓大模型和現(xiàn)有產(chǎn)品整合,解決用戶的痛點,可能是當下所有數(shù)據(jù)公司最大的挑戰(zhàn),同時也是最大的機會。
Talking points
通過交互界面的升級,不是數(shù)據(jù)分析師的普通人,也可以直接使用自然語言查詢和分析數(shù)據(jù)。
企業(yè)將大模型部署到云端數(shù)據(jù)庫將越來越容易,直接使用成品大模型工具分析數(shù)據(jù),也將變得更加簡單。
隨著 AI 的進展,數(shù)據(jù)的價值還將越來越高,數(shù)據(jù)潛力將被進一步釋放。
01
數(shù)據(jù)庫迎來自然語言交互
在會上,Databricks 推出了全新的「神器」LakehouseIQ。LakehouseIQ 承載著 Databricks 近期最大的發(fā)力方向之一——數(shù)據(jù)分析普惠化,即不掌握 Python 和 SQL 的普通人也能輕輕松松接入公司數(shù)據(jù),用自然語言就能進行數(shù)據(jù)分析。
為達到這個目的,LakehouseIQ 被設(shè)計為一個功能合集,既可以被普通終端用戶使用,也可以被開發(fā)者使用,針對不同的用戶設(shè)計了不同的功能。
LakehouseIQ 產(chǎn)品圖|Databricks對于開發(fā)者方面,發(fā)布了 LakehouseIQ in Notebooks,這項功能中,LakehouseIQ 可以利用大語言模型幫助開發(fā)人員完成、生成和解釋代碼,以及進行代碼修復、調(diào)試和報告生成。
而對于普通的非程序員群體,Databricks 則提供了可以直接用自然語言交互的界面,背后由大語言模型驅(qū)動,可以直接用自然語言來搜索和查詢數(shù)據(jù)。同時,該功能與 Unity Catalog 集成,讓公司可以對數(shù)據(jù)的搜索和查詢進行訪問權(quán)限控制,只返回提問者被授權(quán)查看的數(shù)據(jù)。
自大模型推出以來,用自然語言對數(shù)據(jù)進行查詢和分析,其實一直是一個數(shù)據(jù)分析方向的熱點,許多公司在此方向都有所布局。包括 Databricks 的老對手 Snowflake,剛剛宣布的 Document AI 功能也是主打這個方向。
LakehouseIQ 自然語言查詢界面|Databricks不過 Databricks 宣稱,LakehouseIQ 做到了更好的功能。它提到,通用大語言模型在理解特定客戶數(shù)據(jù)、內(nèi)部術(shù)語和使用模式方面擁有局限性。而 Databricks 的技術(shù),能夠利用客戶自己的模式(schema)、文檔、查詢、受歡迎程度、線程、筆記本和商業(yè)智能儀表盤來獲取智能,回答更多查詢。
Databricks 的功能與 Snowflake 的功能還有一個差別,Snowflake 平臺的 Document AI 功能,僅限于對文檔中的非結(jié)構(gòu)化數(shù)據(jù)進行查詢,而 LakehouseIQ 適用于結(jié)構(gòu)化的 Lakehouse 數(shù)據(jù)和代碼。
02
從機器學習到 AI
Databricks 與 Snowflake 在發(fā)布會上的相似之處還不局限于此。
此次發(fā)布會中,Databricks 發(fā)布了 Databricks Marketplace 和 Lakehouse AI,這與 Snowflake 這兩天大會的重點也完全吻合,二者都主打?qū)⒋笳Z言模型部署到數(shù)據(jù)庫環(huán)境中。
在 Databricks 的設(shè)想中,Databricks 未來既可以協(xié)助客戶部署大模型,也提供成品的大模型工具。
Databricks 過去就有 Databricks Machine Learning 的品牌,在此次發(fā)布會上,Databricks 對其進行品牌全面的重新定位,升級為 Lakehouse AI,主打協(xié)助客戶部署大模型。
Databricks 上線了 Databricks Marketplace。在 Databricks Marketplace 中,用戶可以接入經(jīng)過篩選的開源大語言模型集合,包括 MPT-7B、Falcon-7B 和 Stable Diffusion,還可以發(fā)現(xiàn)和獲取數(shù)據(jù)集、數(shù)據(jù)資產(chǎn)。Lakehouse AI 還包括一些大語言模型操作能力(LLMOps)。
Lakehouse AI 架構(gòu)圖|DatabricksSnowflake 也在對此進行積極部署,其相似功能由 Nvidia NeMo、Nvidia AI Enterprise、Dataiku 和 John Snow Labs 提供(與英偉達的合作正是 Snowflake 大會的重點之一,見極客公園的報道)。
在協(xié)助客戶部署大模型方向,Snowflake 與 Databricks 顯現(xiàn)出了分歧。Snowflake 選擇積極地與合作伙伴進行合作,而 Databricks 則試圖將該功能作為其核心平臺的本地特性添加進去。
而在提供成品工具方面,Databricks 宣布 Databricks Marketplace 未來還將可以提供 Lakehouse Apps。Lakehouse Apps 將直接在客戶的 Databricks 實例上運行,它們可以與客戶的數(shù)據(jù)集成,使用和擴展 Databricks 服務,并使用戶能夠通過單點登錄體驗進行互動。數(shù)據(jù)永遠不需要離開客戶的實例,沒有數(shù)據(jù)移動和安全 / 訪問問題。
這點則與 Snowflake 公司的產(chǎn)品從命名到功能上都直接撞車。Snowflake 公司與之相似的 Snowflake Marketplace 和 Snowflake Native App 已經(jīng)上線,是其發(fā)布會的重點之一。彭博社就在 Snowflake 的大會上宣布了一個由彭博社提供的 Data License Plus ( DL+ ) APP,允許客戶在云端用幾分鐘時間就能配置一個隨時可用的環(huán)境,內(nèi)部設(shè)有完全建模的彭博訂閱數(shù)據(jù)和來自多供應商的 ESG 內(nèi)容。
03
數(shù)據(jù)平臺迎來新變革
開幕式主旨演講上,Databricks 公布了一個數(shù)字:過去 30 天,已經(jīng)在 Databricks 平臺上訓練 Transformer 模型的客戶超過 1500 家。
在談及這個令人印象深刻的數(shù)字時,PingCAP 劉奇認為,這說明企業(yè)應用 AI 的速度比預期的要快得多,「應用模型不一定要去訓練模型,所以如果訓練的都有 1500 家,那應用的肯定要比這個(數(shù)字)大的多得多。」
另一方面,這也表明 Databricks 在 AI 這個領(lǐng)域的布局相對完整。「它現(xiàn)在不僅僅是一個 Data Warehouse(數(shù)據(jù)倉庫),一個 Datalake(數(shù)據(jù)湖)。現(xiàn)在它還提供:AI 的 training(訓練)、AI 的 serving(服務),模型的管理等一整套。」
Ali Ghodsi 以計算和互聯(lián)網(wǎng)的革命,類比大模型之于機器學習的變革|Databricks也就是說,底層模型可以通過 Databricks 的平臺去訓練,「最底層的模型改改參數(shù)就能訓練」。在這個模型之上所需要的 AI 服務,Databricks 也布局了相應的基礎(chǔ)設(shè)施——今天發(fā)布了 vector search(向量搜索)和 feature store(特征庫)。
Databricks 全面向大模型升級。
過去,Databricks 在 AI 方面有很多積累,比如在建索引、查數(shù)據(jù)、預測工作負載等方面,用小模型來提高效率、降低時延。但是,以如此快的速度補上大模型的能力,還是讓不少人意外。
在今天峰會全面展示的 AI 布局之前,Databricks 收購了 Okera(AI 數(shù)據(jù)治理),推出了自家的開源大模型 Dolly 2.0,又以 13 億美元并購了 MosaicML,一連串的動作一氣呵成。
對此,硅谷徐老師 Howie 認為,Databricks 和 Snowflake 這兩個大會都可以比較明確地看出:兩家公司的創(chuàng)始人認為,基于數(shù)據(jù)庫、數(shù)據(jù)湖他們所做的行動、接下來會面臨根本性的改變。按照一年前他們在做的思路,在未來幾年行不通。
相應地,快速補齊大模型的能力,也意味著可以獲得由于大模型帶來的增量市場。
劉奇認為,沒有大模型之前,很多的需求可能都不存在,但有了大模型之后,有了很多新增需求。「因為只有模型沒有數(shù)據(jù),干不了什么事情,特別是沒有辦法做出差異化。如果大家都是一個大模型,那你跟別人可能也沒有差別。」
但比起大模型,峰會現(xiàn)場的觀眾似乎更關(guān)注小模型,因為小模型的幾個優(yōu)勢:速度、成本、安全性。劉奇表示,基于自己獨有的數(shù)據(jù),做出差異化的模型,模型要足夠小才能滿足這三條:足夠便宜、足夠快、足夠安全。
值得注意的是,Databricks 和 Snowflake 在日前都公布了它的營收數(shù)據(jù),平臺年營收增長在 60% 以上。相比整個市場軟件支出放緩的大背景,這樣的增長速度反映了數(shù)據(jù)越來越被關(guān)注。這次 Databricks 峰會的主題也是數(shù)據(jù)加 AI,但有了大模型,數(shù)據(jù)的價值還將越來越高。
大模型的到來,讓數(shù)據(jù)自動生成成為可能,可以預見,數(shù)據(jù)量將指數(shù)級增長。怎么輕松地訪問數(shù)據(jù)、怎么支持不同的數(shù)據(jù)格式、挖掘數(shù)據(jù)背后的價值,會成為越來越頻繁的需求。
另一方面,今天很多企業(yè)還在還在探索觀望將大模型接入企業(yè)軟件,但考慮到安全、隱私、成本,敢直接用的,還很少。一旦通過將大模型直接部署到企業(yè)數(shù)據(jù)上,無需移動數(shù)據(jù),部署大模型的門檻將被進一步降低,數(shù)據(jù)被消費的數(shù)量和速度都將被進一步釋放。
責任編輯:hnmd003
相關(guān)閱讀
-
全球快看:一家 380 億美元的數(shù)據(jù)巨頭,要掀起企業(yè)「AI 化」革命
作者|宛辰、LiYuan編輯|靖宇當?shù)貢r間6月28日,美國知名數(shù)據(jù)平臺Databri
2023-06-30 -
Canalys:預估蘋果 Vision Pro 頭顯上市后五年累計銷量會超 2000 萬臺_頭條焦點
鈦媒體App6月30日消息,據(jù)市場調(diào)查機構(gòu)Canalys發(fā)布的最新報告,蘋果拓
2023-06-30
相關(guān)閱讀
-
全球快看:一家 380 億美元的數(shù)據(jù)巨頭,要掀起企業(yè)「AI 化」革命
作者|宛辰、LiYuan編輯|靖宇當?shù)貢r間6月28日,美國知名數(shù)據(jù)平臺Databri
-
環(huán)球快資訊:微軟收購驚動索尼,兩大巨頭明爭暗斗多年!
微軟收購驚動索尼一場全球矚目的反壟斷監(jiān)管訴訟,一個改變行業(yè)格局的天
-
Canalys:預估蘋果 Vision Pro 頭顯上市后五年累計銷量會超 2000 萬臺_頭條焦點
鈦媒體App6月30日消息,據(jù)市場調(diào)查機構(gòu)Canalys發(fā)布的最新報告,蘋果拓
-
小米、騰訊、吉利等巨頭持股 黑芝麻智能沖刺港股 IPO
【CNMO新聞】6月30日,CNMO從媒體獲悉,汽車AI芯片開發(fā)商黑芝麻智能近
-
全球今日訊!給 AI 打下手,我被搶了“飯碗”
Tech星球(微信ID:tech618)文|陳橋輝封面來源|圖蟲創(chuàng)意任何一項新技
-
單位存款有哪些?如何存款可以獲得更高的利息?
不少的小伙伴在選擇銀行存款時,大部分都會選擇活期存款,最大的原因之一就在于它沒有固定期限,可以隨...
-
公章莫名消失!業(yè)內(nèi)人士:從未遇過 天天觀天下
作者丨唐韶葵編輯丨張偉賢圖源丨圖蟲6月的廈門集美新城,天清氣爽,不
-
背靠能源第一省,光伏強市的電不夠用了?
圖片來源:包頭發(fā)布最近,一則傳聞把包頭送上輿論風口。據(jù)上海有色網(wǎng)消
-
法人貸款需要什么條件?法人貸款無力償還后果
法人貸款需要什么條件?1、客戶群體:年齡在24-65周歲,成立6個月以上且三證俱全的有限公司或獨資企業(yè)法...
-
京東養(yǎng)車在西藏拉薩開業(yè)
京東集團旗下的汽車養(yǎng)護連鎖品牌——京東養(yǎng)車拉薩門店近日在拉薩市城關(guān)
-
信息:西藏改則縣生態(tài)文明建設(shè)掃描:守護羌塘腹地 打造動物天堂
這世上總有一些人,在常人難以注目的地方默默奉獻著。
-
西藏自治區(qū)市場監(jiān)管局召開行政指導和政策解讀座談會 全球時快訊
近日,西藏自治區(qū)市場監(jiān)管局網(wǎng)監(jiān)處組織西藏美團和餓了么平臺相關(guān)負責人
-
速看:拉林鐵路開通運營兩周年
2023年6月25日,是拉林鐵路開通運營兩周年,記者從拉薩火車站獲悉,兩
-
三無食品怎么處罰?三無食品的處罰標準是什么?
一、三無食品是指什么三無食品中有可能含有色素和防腐劑的食品,甚至是地下工廠生產(chǎn)的食品。食用了這一...
-
網(wǎng)購收貨付款有什么注意事項?網(wǎng)購交易規(guī)則都有哪些?
1、多了解寶貝細節(jié),了解賣家在出價前,您可以通過各種方式了解有關(guān)交易的信息。比如物品的具體細節(jié),對...
-
到期還款日是什么意思?到期還款日和最后還款日區(qū)別
到期還款日是什么意思?信用卡到期還款日是指信用卡最后的還款日期。每張信用卡都有一次修改還款日期的機...
-
7月起一批新規(guī)將施行 涉鐵路出行、消費者權(quán)益、低保標準等
①全國性新規(guī):國六b排放標準將全面實施、全國鐵路實行新的列車運行圖
-
企業(yè)所得稅季報是什么?企業(yè)所得稅應該怎么繳納呢?
大家都知道,企業(yè)是需要繳納企業(yè)的一個所得稅的,那么,對于企業(yè)所得稅來說,企業(yè)所得稅應該怎么繳納呢?...
-
刑法有泄露公民個人隱私罪嗎?中華人民共和國刑法第二百五十三條的內(nèi)容是什么?
一、個人隱私信息包括什么私人隱私就是私人生活秘密,是指私人生活安寧不受他人非法干擾,私人信息保密...
-
進球網(wǎng):卡斯特羅接受利雅得勝利邀請,將擔任球隊主教練_觀速訊
進球網(wǎng):卡斯特羅接受利雅得勝利邀請,將擔任球隊主教練,卡斯特羅,利雅
-
公司可以抵押貸款嗎?公司抵押貸款的特點是什么?
的條件才惡意。下面小編為大家詳細介紹一下相關(guān)知識,希望對大家有所幫助。一、公司可以抵押貸款嗎公司...
-
避免個人債務糾紛要注意以下幾個方面?下列哪種情況下是允許債權(quán)人扣押財產(chǎn)?
一、所謂的清債公司是合法的嗎我國現(xiàn)行的法律法規(guī)并不允許成立討債或清債公司之類的組織,發(fā)生債務糾紛...
-
檔案管理方法有哪些?檔案管理的內(nèi)容是什么?
一、檔案管理方法有哪些1、抽屜式直立檔案。所謂抽屜式就是立在地面上的分層的抽屜,這種方式能夠?qū)⒎N類...
-
股票交易傭金是多少?股票交易要交哪些費用?
股票交易傭金是多少?1、不同的營業(yè)部的傭金比例不同,極個別的營業(yè)部還要每筆收1-5元的委托(通訊)費。2...
-
世界實時:果粉網(wǎng)傳新iphone 大遲到11月底_果粉網(wǎng)創(chuàng)始人
想必現(xiàn)在有很多小伙伴對于果粉網(wǎng)創(chuàng)始人方面的知識都比較想要了解,那么
-
建設(shè)銀行信用卡好辦嗎?建設(shè)銀行信用卡辦理需要什么條件?
建設(shè)銀行信用卡好辦嗎?建設(shè)銀行是比較好申請的,只要用戶符合建設(shè)銀行的申請條件,想要成功下卡還是很容...
-
環(huán)境污染防治原則都有哪些?完善環(huán)境管理體制都有什么?
一、環(huán)境污染有哪些1、空氣污染:包括企業(yè)廢氣排放污染、機動車尾氣排放污染、飲食業(yè)油煙排放污染、建筑...
-
滬深300股指期貨怎么開戶?滬深300股指期貨一手多少錢?
滬深300股指期貨怎么開戶?個人攜帶本人身份證、銀行卡復印件或者掃描件1份、身份證掃描件(電子版)、個人...
-
房地產(chǎn)業(yè)務都包括哪些?房地產(chǎn)經(jīng)營是指什么內(nèi)容?
房地產(chǎn)經(jīng)營是指房地產(chǎn)開發(fā)企業(yè)的中介組織進行房地產(chǎn)項口轉(zhuǎn)讓、商品房預售、銷售以及租賃等商業(yè)活動。具...
-
天天觀天下!國際油價29日上漲
南方財經(jīng)6月30日電,。截至當天收盤,紐約商品交易所8月交貨的輕質(zhì)原油
精彩推薦
閱讀排行
精彩推送
- 風險可控、理性發(fā)展、長期回報…...
- 建筑面積和使用面積的區(qū)別是什么...
- 去臺灣要簽證嗎?怎么辦理簽證呢?
- 生產(chǎn)者能夠證明有哪些情形不承擔...
- 進口車銷量暴跌!雷克薩斯、寶馬...
- 長城汽車荊門工廠新增三款車型-...
- 股權(quán)激勵是什么意思?公司股權(quán)激...
- 法律意見書格式都有什么內(nèi)容?法...
- 文明實踐在行動|營造清朗社會文...
- 護航未成年人成長|筑牢校園“防...
- 三證齊發(fā) 跑出審批“加速度”
- 每日關(guān)注!“法稅協(xié)作”出新招 ...
- 什么是社保卡?社保卡可以當銀行...
- 文明實踐在行動|稀土高新區(qū):精...
- 營業(yè)稅勞務范圍是什么?什么是營...
- 匯票和本票的區(qū)別是什么?匯票和...
- 公司增資的主要方式都有哪些?申...
- 移倉是什么意思?期貨主力移倉會...
- 規(guī)章制度的作用都有什么?規(guī)章制...
- 股票漲停可以買嗎?股票漲停為什...
- 工業(yè)總產(chǎn)值的計算原則是什么?目...
- 白銀期貨保證金是什么意思?白銀...
- 游客開車壓草場牧民損失數(shù)萬!牧...
- 敞口是什么意思?風險敞口怎么計...
- 焦點快報!外媒:蘋果更重視 iOS...
- AI 公司 Inflection 融資 13...
- 世界百事通!鈦媒體科股早知道:...
- 售價 4 萬美元、限量 24 臺...
- 罕見 4GB 未拆封初代 iPhone...
- 全球聚焦:美國駐北約大使:成員...




