文 / 六金
出品 / 節(jié)點商業(yè)組
大模型熱度遲遲不退,有能力的企業(yè)紛紛搶占生態(tài)位。百度、阿里、華為、商湯、科大訊飛、360等大型互聯(lián)網公司,都已經在國內展開了“諸神之戰(zhàn)”。
在媒體報道中,參與了大模型競技的公司幾乎都是大公司。這是因為投入大模型,最直觀的需求就是“錢”。大廠能成為“開卷”的主力軍,主要是因為大模型的開發(fā)訓練,資金、技術門檻都很高,并非創(chuàng)業(yè)者以及小公司可以輕松吃下的蛋糕。
例如國盛證券的一份研報顯示,GPT-3訓練一次的成本約為140萬美元,對于一些更大的LLM模型,訓練成本介于200萬美元至1200萬美元之間。這一成本于全球科技大企業(yè)而言并不便宜,但也在可接受范圍內。
將大模型的投入“坦誠相告”
由于“貴”,投身大模型的很多企業(yè)其實都沒告訴投資者們,自己花了多少錢,估計也是怕投資者看到后會產生認知偏差。
最近科大訊飛發(fā)了財報,倒是對這一點很坦誠,2023年一季度科大訊飛的利潤轉虧,其管理層明確表示,除了一些去年遺留的特殊問題外,是因為公司在2022年12月15日啟動了“1+N認知智能大模型”的專項攻關,將于2023年5月6日正式發(fā)布訊飛星火大模型,攻關項目的新增投入一定程度上影響了當期利潤。
科大訊飛的掌門人劉慶峰說得很明白:“針對大模型的技術投入,我們該投的投、絕不手軟。”所以在行業(yè)內,大家不妨都坦誠點,畢竟大模型已經成為了“陽謀”,花錢投入也是為收獲果實打基礎。當年馬斯克不就是嫌再次投資OpenAI太貴,后來又想去“摘桃子”被拒之門外了嗎?
除了“投錢”以外,大模型還需要“投人”,在這一點上,國內外廠商的爭搶都很激烈。“谷歌大腦”的大模型人才,從去年底到今年被OpenAI挖走了好幾個;節(jié)點財經也聽說,某一線大廠開價140萬美元年薪,挖腳OpenAI的員工。在國內,有公司廣發(fā)英雄帖,把公司的大部分股權拿出來獎勵研發(fā)人才。
但是有NLP領域的專家對節(jié)點財經表示,做大模型這樣的前沿核心技術研發(fā)還不能只靠高薪挖人才,更要考慮團隊適配程度。
該人士舉例,研發(fā)大模型是為了落地在業(yè)務上,技術團隊應該充分了解業(yè)務特性。具體到業(yè)務場景,訴求存在著不小的差異,大模型的作用是實時掌握這些需求,并對此作出快速響應。
聽起來理論很簡單,落地可一點都不容易,如果技術團隊沒有磨合、不適配業(yè)務,很可能會導致迭代落后于業(yè)務變化。
不過科大訊飛卻表示,未來一段時間公司不需要太多額外的人力投入,現(xiàn)在訊飛的團隊和資金完全靠得住。有業(yè)內人士分析,科大訊飛敢于這樣說,大概率是因為訊飛研究院作為人工智能創(chuàng)新研究院的“元老級”機構,建制完整、團結且沒有技術上的內耗。
公開資料顯示,目前訊飛研究院最核心的研究團隊有200余人,其中有兩位是《麻省理工科技評論》“35歲以下科技創(chuàng)新35人”榜單中頂尖的年輕科學家,其他團隊成員不少是和訊飛一起成長的博士,憑這一點可以能推測出,這群科學家的特點是“懂訊飛的業(yè)務訴求”。
此外在算力算法方面,訊飛也是業(yè)界公認的AI領域長期堅守者。公開資料顯示,科大訊飛在Transformer深度神經網絡算法方面擁有豐富經驗,已經應用于訊飛的語音識別、圖文識別、機器翻譯等任務中,并達到國際領先水平;而且訊飛創(chuàng)新提出了知識與大模型融合統(tǒng)一的理解框架X-Reasoner,有望彌補大模型的模糊記憶技術短板。
而在算力投入上,訊飛過去幾年就一直牽頭承擔著國家自主可控人工智能平臺的諸多項目、在總部自建有業(yè)界一流的數(shù)據(jù)中心,為大模型訓練平臺建設奠定了基礎條件,另外它之前與華為、寒武紀、曙光等企業(yè),也都建立了深度算力合作。
所以推出大模型,并且讓它具備商業(yè)化條件,對于互聯(lián)網大廠來說并不是一蹴而就的,以科大訊飛為例,它能在認知大模型能實現(xiàn)快速突破、并且敢于披露和預測自己的投入,與長期在人才、算法、算力上的積累密不可分。
大模型賽道,國家隊下場
在這場大模型帶來的AI熱中,還有很多“吃瓜群眾”很難理解科技圈對大模型的擁躉,畢竟類似的場景在元宇宙、AR/VR等領域都出現(xiàn)過。但如果深入回顧人工智能的發(fā)展歷史與傳統(tǒng)AI時代的困境,就能理解大模型之于科技時代的含義。
我們可以將大模型的開發(fā),理解為打造AI時代的“操作系統(tǒng)”,就像我們使用windows系統(tǒng)在電腦中完成工作一樣,經由AI時代的“操作系統(tǒng)”大模型,人人都可以是開發(fā)者,生產出新產品和新的應用場景。
如果上升到這個層面,各個有能力的國家對大模型的基本要求就是“自主可控”。在360宣布進軍大模型領域時,周鴻祎也在采訪中提到,GPT是個生產力工具,這將決定未來國際競爭當中的國運。所以,國家隊也在大模型的開發(fā)和訓練上陸續(xù)下場。
不久前,中國電信布局了企業(yè)版的ChatGPT;復旦大學自然語言處理實驗室開發(fā)的MOSS 模型已經上線開源;中科院自動化所早在2021年就發(fā)布業(yè)界首個圖文音三模態(tài)大模型“紫東·太初”,清華大學、北京大學等院校雖然沒有推出大模型,但是也在人工智能領域國際頂級期刊發(fā)表了多篇大模型相關的重要文章。
某知名互聯(lián)網公司的NLP團隊負責人對節(jié)點財經表示,國家隊下場更容易在一些核心數(shù)據(jù)、參數(shù)上占有優(yōu)勢。大模型的訓練的本質,就是把語料、數(shù)據(jù)、參數(shù)等當作“食物”喂給大模型,當食物品質越高,大模型就會越智能,還能節(jié)省算力。
例如作為“人工智能國家隊”,科大訊飛在中文語料上有著明顯優(yōu)勢。據(jù)了解,在多年認知智能系統(tǒng)研發(fā)推廣中,科大訊飛積累了超過50TB的行業(yè)語料和每天超10億人次用戶交互的活躍應用,擁有大量的機器翻譯、語音識別、語音合成等方面的數(shù)據(jù),這些數(shù)據(jù)均是用于大模型訓練和優(yōu)化自然語言處理模型的重要來源之一。
另外,科大訊飛要搭建的“認知大模型”特別注重多輪對話和邏輯推理,才能在行業(yè)中深度應用,這就意味著需要更高質量的數(shù)據(jù)和參數(shù)。以醫(yī)療領域為例,科大訊飛是全國唯一通過國家執(zhí)業(yè)醫(yī)師資格考試的“人工智能系統(tǒng)”,超過了96.3%的醫(yī)學考生,現(xiàn)在科大訊飛已累計為基層醫(yī)生提供了超過5.8億次、日均超過70多萬人次的人工智能輔診。這就意味著在專業(yè)領域,科大訊飛可以避免一本正經地回復錯誤消息,使得專業(yè)保障性更強,大模型的落地也“更有專長”。
科大訊飛,將人工智能與智慧醫(yī)療深度融合
還有不少機構在研報中提到,科大訊飛在教育領域的應用規(guī)模比醫(yī)療更大、數(shù)據(jù)更翔實,未來的增長更強勁。機構們的肯定也印證了,在真正有剛需、適合認知智能大模型的地方,國家隊下場后可以推動大模型在具體行業(yè)上做得更透。
投入大模型,反哺根據(jù)地
在大模型的“諸神之戰(zhàn)”中還有個特點,即面對著市場上成百上千個大模型投資標的,一級市場和二級市場在投資上都有些不知所措。
有VC合伙人評價,大家都看好大模型的發(fā)展趨勢,也更愿意做跟投,但是一級市場的投資人不一定都能看懂大模型的落地前景,沒有領投人就不知道如何開始。二級市場的投資者則提出了靈魂疑問,現(xiàn)在宣布投身大模型的公司這么多,如何判斷他們是蹭熱點還是真做大模型?我不想買到只會炒作概念的“妖股”。
上海一券商的計算機行業(yè)賣方分析師提出了一個解決方案,對于上市公司,可以仔細觀察企業(yè)有沒有讓大模型反哺主要業(yè)務的發(fā)展。
例如百度的文心一言全面嵌入百度內部工作平臺如流、對外也上車了百度apollo等業(yè)務;釘釘也表示全面接入阿里的 "通義千問 "大模型,增加了 10余種 AI能力、對外也表示要開放;WPS AI表示將嵌入金山辦公全線產品,科大訊飛的投資者交流會中也表示,大模型對于其根據(jù)地業(yè)務,有著很大推動意義。
據(jù)了解,科大訊飛即將發(fā)布的星火大模型是“1+N認知智能大模型”,其中“1”是代表的是大模型訓練平臺,“N”是應用于教育、醫(yī)療、人機交互、辦公、翻譯、工業(yè)、汽車等多個根據(jù)地領域的專用大模型版本。
能提出這樣的模型架構,是因為科大訊飛在行業(yè)內是少數(shù)既懂B端又懂C端的AI公司。劉慶峰預測道,超大規(guī)模的大模型已經到了一個臨界點,下一個階段應該用更多專業(yè)的子模型來協(xié)同訓練,獲得更可靠的成效。
這個專業(yè)階段的子模型,關聯(lián)的就是科大訊飛的“根據(jù)地業(yè)務”,之前我們看科大訊飛的財報時,其根據(jù)地業(yè)務的基本盤一直非常穩(wěn)健,例如去年即使在宏觀因素的擠壓和疫情影響時,科大訊飛根據(jù)地業(yè)務仍能實現(xiàn)23%的增長。而基于上文提到語料、數(shù)據(jù)、參數(shù)的優(yōu)勢,專業(yè)模型通過協(xié)調聯(lián)動,根據(jù)地業(yè)務還能形成效益的提升。
劉慶峰同樣預測道,訊飛在教育、醫(yī)療等根據(jù)地業(yè)務上的大模型成效不比千億級模型差。特別是想要形成通用領域的智慧涌現(xiàn),需要把這些模型的知識相互銜接,在整體的大模型中去統(tǒng)一訓練,未來就有希望在教育、辦公、醫(yī)療等應用領域搶占先機。有不少機構同樣預測道,星火認知大模型反哺業(yè)務,會讓科大訊飛的根據(jù)地業(yè)務壁壘更加深厚。
幾天前,被譽為“AI界傳奇”的陸奇在《我的大模型世界觀》演講中提到了對于大模型的展望,即大模型是平臺型機會,以模型為先的平臺需要以下幾個特征:1.開箱即用;2.要有一個足夠簡單和好的商業(yè)模式;3.有自己殺手級應用。
所以星火大模型的發(fā)布落地,不僅是簡單易用的專業(yè)化模型;還可以在科大訊飛自己的教育、醫(yī)療、辦公等場景打造經典應用;再經由訊飛的開放平臺開放出去,讓AI認知大模型從“可用”階段邁入“常用”階段,帶動AI時代的“操作系統(tǒng)”更加普惠化;最后為大模型的使用者創(chuàng)造現(xiàn)金流、創(chuàng)造真金白銀的產業(yè)附加值,這才是大模型的發(fā)展“偉力”。
節(jié)點財經聲明:文章內容僅供參考,文章中的信息或所表述的意見不構成任何投資建議,節(jié)點財經不對因使用本文章所采取的任何行動承擔任何責任。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!