大模型生成的下一個正規化:從“能說會道”到貫通行業

從單一文字到“X”的躍遷,開啓大模型落地新紀元。
作者 |  程茜
編輯 |  漠影

行業需要怎樣的大模型能力?


目前,大語言模型的生成、理解能力目前大多以文字為載體,通過此前的文字去預測下一個文字,從而形成完整的文字迴答。但當其深入行業,單靠文字這一形式很難解決實際問題。


如用戶的體檢報告、器材設備的檢測數據等,通常並不會直接以文字齣現,而這些有價值的數據正在被大模型能力重塑。


今天,第四範式發布的行業大模型平颱先知AIOS 5.0作為一大載體將這些麵嚮不同場景的行業大模型能力集成瞭起來。

大語言模型的原理在於Predict the Next “X”,“X”這一未知數的指代形式正不斷擴展延伸,在AIOS 5.0之上,它可以是用戶的一份個人體檢報告,也可以是水文數據、設備檢修數據等多元化形態。

那麼,“X”的這些不同形態數據落地到行業中後錶現如何?我們通過深入剖析幾大行業大模型的典型案例,找到這些問題的答案。

01.
行業大模型承載多元化場景需求


話不多說,先來看看與我們日常生活密切相關的場景。

正如開篇提到的健康領域,在慢病管理大模型中,當“X”化身為用戶的個人體檢報告,就可以基於過去5年的體檢報告數據,依次生成未來3年的體檢報告,並且給齣一些可能引發慢性病的核心指標的變化趨勢,供醫生參考給齣相應的健康管理建議。

其次,在一些數據量龐大的工作場景中,由於對數據量的利用率不夠,往往需要人工監測、計算,會導緻浪費大量的時間精力。當設備檢測數據、水文數據變成“X”,AI的加持就能讓這些數據的價值更高效釋放齣來。
在水電領域,水電設備大模型可以基於過去7天機組子部件的運行狀態,生成未來3天小時級的定轉子部件報告,供運維人員給齣維修方案;在水務領域,水務大模型可以依據曆史數據和未來7天氣象數據, 生成未來7天小時級的報告,供水文監測人員識彆發生洪水及相關次生災害險情、采取應急預案。

除此以外,行業大模型還有很多提升用戶各項體驗的多元化能力,如AIOS 5.0平颱中的聲效大模型,可以基於音樂廳的幾何模型和房間數據,幫助專業人員評估音源擺放位置,從而讓觀眾的聽覺體驗更好。

可以看齣,大模型的能力正在從語言等單一形態為中心不斷嚮外擴散,讓“X”化身不同行業的數據類型,在不同的垂直場景釋放齣更大的業務價值,真正成為解決場景核心痛點、問題的載體。

02.
先知AIOS 5.0成“最佳練兵場”


大模型深入行業已經成為産業發展的一大趨勢。
從大模型的發展來看,現在已經不僅僅唯參數規模而論。一方麵,大模型參數規模繼續擴大,並不斷激發其更智能化、聰明能力之路上極速狂奔;另一方麵,更多參數規模相對較小,更能解決行業痛點問題的模型齣現。
這背後的原因在於,基礎模型的算力規模非一般公司可以承載,上周,微軟工程師Kyle Corbitt就在社交平颱X上爆料,微軟已經在悄悄為OpenAI開始訓練GPT-6,預計要部署10萬個H100 GPU,而一個H100售價2.5萬~3萬美元。如此龐大的算力規模,使得企業付齣的金錢成本更高。
當前對於行業大模型的普遍認知就是用大語言模型去fine-tune行業數據,解決行業特定問題。大語言模型作為語言“通纔”,能夠學習理解文本知識,但放到垂直場景解決,解決數學題或者是經驗題,這些都遠遠超齣瞭“語言”的範疇。
在這樣的背景下,第四範式打造的先知AIOS 5.0,就是承載大模型在行業應用的關鍵底座。讓“X模態”的數據,能像文字一樣快速被處理,並解決高價值的問題。

03.
結語:大模型部署落地新周期
深耕多元場景


前沿技術的進步能對人們生活産生價值纔是關鍵,大模型的能力與人們日常生活的結閤日漸緊密。但龐大的算力需求等挑戰使得基礎模型的能力無法真正釋放給每一個人,行業大模型的優勢顯現齣來。
第四範式打造的行業大模型平颱在讓大模型與行業的場景需求結閤的更加緊密的同時,進一步降低瞭業務人員應用大模型的開發門檻,開啓瞭大模型落地部署的産業新周期。

(本文係網易新聞•網易號特色內容激勵計劃簽約賬號【智東西】原創內容,未經賬號授權,禁止隨意轉載。)

2024年中國生成式AI大會預告