1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

最后一公里不解決,大模型開閉源都一文不值

 2024-07-18 10:22  來源:A5專欄  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

對所有大模型而言,其真正考驗如同科大訊飛創(chuàng)始人劉慶峰所說,在最后一公里的應(yīng)用和商業(yè)化落地上。

作者|Cindy

編輯|楊 銘

恐怕誰也不會想到,百模大戰(zhàn)進入商業(yè)化下半場,圍繞大模型大規(guī)模、曠日持久的戰(zhàn)爭,竟是開源和閉源路線的交鋒。

最近,在2024世界人工智能大會(WAIC)上,劉慶峰、李彥宏、王堅、朱嘯虎、傅盛等行業(yè)大佬,發(fā)表的截然不同觀點,再次引發(fā)外界對大模型路線的關(guān)注。

比如,持續(xù)輸出“開源落后于閉源”“大模型場景下,開源是最貴的”觀點的百度創(chuàng)始人李彥宏,再次直言不諱認為,開源是一種智商稅。獵豹移動董事長兼CEO傅盛,則繼王小川、周鴻祎之后,直接不客氣反駁李彥宏,稱“付費閉源大模型才是智商稅”。谷歌前董事長施密特甚至在近日表示,中國AI發(fā)展基本靠西方開源,因此必須限制開源模型。

大模型賽道的開源閉源,主要是指模型源代碼、模型權(quán)重、訓(xùn)練數(shù)據(jù)是否公開。這場AI浪潮下科學(xué)界的戰(zhàn)爭,并非僅發(fā)生在中國企業(yè)身上——相比中國企業(yè)家的“文明交鋒”,國外企業(yè)和大佬更是采用直接短兵相接的肉搏戰(zhàn)方式。

去年2月以來,馬斯克屢屢發(fā)難,稱轉(zhuǎn)向閉源的OpenAI應(yīng)改名為“Close AI”。今年2月,馬斯克在舊金山法院對OpenAI及CEO阿爾特提起訴訟,要求OpenAI恢復(fù)開源并給予賠償。市場方面,去年7月Meta將Llama2(羊駝)開源后,和ChatGPT發(fā)生的一輪輪攻防戰(zhàn),同樣精彩紛呈。

風(fēng)云涌動中,圍繞大模型開閉源的白刃戰(zhàn)超過一年半。但至今誰也說服不了誰,誰也未取得決定性勝利,未來走向撲朔迷離。

唯一能確定的是,對公眾和企業(yè)來說,無論路線如何,解決不了最后一公里難題,開閉源都一文不值。對所有大模型而言,其真正考驗如同科大訊飛創(chuàng)始人劉慶峰所說,在最后一公里的應(yīng)用和商業(yè)化落地上。

01

開閉源路線之爭的本質(zhì)

回顧互聯(lián)網(wǎng)和軟件史,開源和閉源的戰(zhàn)爭一直都在上演。

直到今天,這依然是兩股并行、截然不同的力量。開源方面,以Linux、Android、unix為代表;閉源方面,則有Windows、Mac OS、iOS、WP等等。

戰(zhàn)爭核心,在于技術(shù)進步、‌安全保障、‌社會價值與經(jīng)濟效益之間的平衡探索。

開源認為,應(yīng)允許任何人獲得并修改軟件的源代碼,如同一座橋梁,‌分享、融合才是其存在意義。閉源則認為,軟件和代碼屬于勞動成果,勞動成果需要保護和用來獲取財富。

客觀看,開源促進軟件繁榮和全球范圍內(nèi)合作,拓寬創(chuàng)新邊界上,居功至偉。但就商業(yè)價值層面來看,此前所有領(lǐng)域都被閉源吊打。

一切技術(shù)路線爭議終點,需要商業(yè)化掙錢。這無可厚非,但需要意識到的是,AI大模型的路線戰(zhàn)爭,和此前任何一次開閉源戰(zhàn)爭都沒可對比性——業(yè)界共識是,大模型本身就是一個黑盒子,外界至今難以徹底揭開它的神秘。

從模型、算法到數(shù)據(jù),如何產(chǎn)生一個可以使用的模型,無人知曉。未來到底是走向中心化,還是去中心化,都是矛盾而又流行的說法。

這種神秘性,造就大模型的獨特性——無論是國外還是國內(nèi),都不是巨頭的一枝獨秀,從科研到創(chuàng)業(yè)者,再到千行百業(yè)開發(fā)者,都可以參與其中,讓大模型呈現(xiàn)百花齊放、百家爭鳴的蓬勃生態(tài)。

技術(shù)實力來看,如果以ChatGPT為標尺,那么開源曾很長一段時間落后于閉源——到去年下半年,這種情況已經(jīng)改變,很多超過 ChatGPT 3.5,甚至追趕ChatGPT 4.0能力的大模型陸續(xù)發(fā)布。不過,在Sora發(fā)布后,閉源又獲得一段時間領(lǐng)先。

“閉源和開源大模型,很難說誰就會永遠領(lǐng)先誰,這是一個永遠在動態(tài)平衡變化的狀態(tài)。”多位業(yè)內(nèi)人士就認為,其差距取決于,研發(fā)團隊能力的差異,以及背后團隊所持有的資金、算力、數(shù)據(jù)。

非得在開源與閉源之間,做選擇題嗎?顯然不是。

如今,在開閉源陣營之爭外,還有一條技術(shù)路線陣營正迅速擴大——開源和閉源同時并行發(fā)展。在國外,以谷歌為代表;在國內(nèi),則包含科大訊飛、昆侖萬維、零一萬物、百川智能等企業(yè)。

這個陣營的技術(shù)實力,并不遜色任何開源或閉源企業(yè)。比如訊飛星火,V3.0版本在中文上全方位超越Chat GPT,英文上實現(xiàn)對標。而在V4.0版本中,在8個國際主流測試集中排名第一,在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力等方面實現(xiàn)了對GPT-4 Turbo的整體超越。

02

開源與閉源,為何可以兩條腿走路

“極點商業(yè)”觀察來看,選擇開源、閉源“兩條腿”走路的企業(yè),布局大多主要遵循以下路徑:在最大模型上選擇閉源,在較小模型上選擇開源。

比如谷歌,就在推出“開源”大模型Gemma后,走上閉源+開源并行道路。有報道認為這代表谷歌大模型策略的轉(zhuǎn)變——開源主打性能最強大的小規(guī)模模型,希望戰(zhàn)勝Meta和Mistral AI;閉源則主打規(guī)模大效果最好的大模型,希望盡快追上OpenAI。

在國內(nèi),“兩條腿走路”的企業(yè)也類似。以科大訊飛為例,整體超越GPT-4 Turbo的訊飛星火V4.0是閉源,通過昇騰AI和訊飛星火的合作,打破大模型訓(xùn)練的瓶頸;而130億參數(shù)的星火開源-13B則是開源,在多項知名公開評測任務(wù)中名列前茅。

其實,大模型不像手機操作系統(tǒng),必須在IOS或安卓之間二選一,對開發(fā)者、用戶、企業(yè)來說,考慮的很直接:這個大模型是否易用好用,又同時具有性價比?穩(wěn)定性、安全性是否可以保證?其生態(tài)和場景打造,又是否滿足用戶需求?

這意味著,讓所有用戶、企業(yè)、開發(fā)者乃至產(chǎn)業(yè),都能選擇合適自己的大模型,就是最好的大模型。

這也是科大訊飛“兩條腿走路”核心目的,通過“閉源+開源”完整體系,閉源專注商業(yè)應(yīng)用、產(chǎn)業(yè)落地,開源策略是生態(tài)開放,兩者優(yōu)勢“合二為一”,激發(fā)中國大模型的產(chǎn)業(yè)、生態(tài)活力。

在閉源部分,基于星火大模型V4.0,科大訊飛有面向TOC的AI應(yīng)用訊飛星火APP/Desk、星火智能批閱機、訊飛AI學(xué)習(xí)機、訊飛曉醫(yī)APP;面向TOB和生態(tài)伙伴,有星火企業(yè)智能體平臺、招采助手、機器人超腦平臺2. 0等等,讓企業(yè)可以構(gòu)建自己的智算底座。

星火開源公開測評數(shù)據(jù)

在開源的星火大模型,科大訊飛的策略是生態(tài)開放,通過免費大模型,為開發(fā)者、學(xué)術(shù)界賦能。

“開源+閉源”兩條腿想順利走路關(guān)鍵,需要解決幾個關(guān)鍵問題,一是模型架構(gòu)自主可控,有一定技術(shù)優(yōu)勢,二是產(chǎn)業(yè)落地、商業(yè)模式完整,三是通過社區(qū)吸引更多開發(fā)者。

“誰控制了過去,誰就控制了未來;誰控制了現(xiàn)在,誰就控制了過去。”近年來,被“卡脖子”事件屢屢在我國科技產(chǎn)業(yè)上演,算力、數(shù)據(jù)是否會“卡大模型的脖子”,業(yè)界也是議論紛紛。

這意味著,主流國產(chǎn)、自主可控的模型架構(gòu),才可能最大限度發(fā)揮生態(tài)力量,匹配產(chǎn)業(yè)上下游環(huán)境,更好推進開源、閉源的并行融合。

“所有算法都是我們自主可控的,大模型的每一行代碼、每一個數(shù)據(jù)都是我們自己編寫、清洗出來的。”劉慶峰表示。

而對處于早期的大模型來說,無論是開源、閉源,都需要聚集更多開發(fā)者,參與到開源模型的改進和優(yōu)化。

在國外,包括Meta、谷歌和微軟以及第三方開發(fā)者都在社區(qū)內(nèi)發(fā)布模型、參數(shù)、數(shù)據(jù)集;在國內(nèi),訊飛開放平臺之上大模型總開發(fā)者超35萬,其中企業(yè)開發(fā)者超22萬,推動大模型應(yīng)用加速落地。

回顧PC、軟件、手機歷史,其實也有類似案例。比如在數(shù)據(jù)庫市場,Oracle就是“開源+閉源”兩條腿走路,在開源社區(qū)、商業(yè)應(yīng)用均取得了巨大成功。

谷歌、科大訊飛們的大模型“兩條路”邏輯其實也類似。一種解讀是,在大模型時代,開源、閉源只是手段,在不同產(chǎn)品和應(yīng)用場景中,兩者本是相輔相成。開源模型和開源社區(qū)可以在上游用免費策略負責(zé)擴大用戶基數(shù)、拓展產(chǎn)業(yè)生態(tài)、迭代模型技術(shù)。

來自開源部分的經(jīng)驗,也可以復(fù)用到閉源,讓閉源大模型的產(chǎn)業(yè)化、商業(yè)化落地更順暢——最終兩條路線以多元化、靈活化的方式演進,并行甚至融合互補。

“實際上這兩塊是相互補充的。”科大訊飛創(chuàng)始人劉慶峰也認為。他以星火開源13B模型為例指出,等650億、1500億、1750億參數(shù)以及更大模型出來,就知道了它的天花板和邊界,再對它進行裁剪、濃縮,就變成13B,那13B的效果也提升了。

“如果不做閉源,不探索行業(yè)最高的天花板,開源也做不到最好。”劉慶峰就認為。

“兩條腿”走路的互補價值,浙江大學(xué)人工智能研究所所長吳飛一個觀點是,任何開源基座模型,都是千錘百煉而來,不是所有公司和機構(gòu)都具備這樣的能力。“在開源之上進行閉源,可以很大程度上降低閉源模型研發(fā)的門檻。”

03

最后一公里才是真正挑戰(zhàn)

從劉慶峰、李彥宏、王小川等行業(yè)大佬觀點來看,一個共同之處是:閉源、開源只是手段,關(guān)鍵是讓大模型,如何快速應(yīng)用千行百業(yè)場景里,如何作為生產(chǎn)力工具,更好地普惠,去替代人類完成各類業(yè)務(wù)流的碎片、繁雜工作。

這意味著,對國內(nèi)目前尚處于高速發(fā)展階段的大模型而言,隨著開源、閉源路線的逐漸并行融合,選擇什么路線不是關(guān)鍵問題。

不同場景適配不同的參數(shù)。如同劉慶峰所說,無論大模型如何演進,最后一公里的產(chǎn)品體驗和應(yīng)用落地,才是真正挑戰(zhàn)。

這也是誰能在“百模大戰(zhàn)”中占有一席之地,擁有更多的話語權(quán)的關(guān)鍵。如果解決不好最后一公里,那么技術(shù)路線將一文不值。當前國內(nèi)大模型企業(yè)的應(yīng)用開發(fā)的普遍思路是,并未等到技術(shù)完全成熟再落地應(yīng)用,而是在快速迭代技術(shù)同時,從ToC、ToB兩端入手,相應(yīng)地進行產(chǎn)業(yè)和應(yīng)用落地。

這一點,在剛剛結(jié)束的WAIC上也體現(xiàn)得很明顯。科大訊飛、百度、阿里巴巴、騰訊、華為、字節(jié)跳動、快手等行業(yè)巨頭,以及百川、智譜等新銳帶來眾多新技術(shù)和新產(chǎn)品,展現(xiàn)了大模型和金融、醫(yī)療、教育、政務(wù)等多個行業(yè)、產(chǎn)業(yè)的深度融合。

關(guān)于如何更好地解決企業(yè)大模型應(yīng)用的“最后一公里”問題,科大訊飛經(jīng)過和大量的央國企和行業(yè)合作伙伴的共同探討,他們認為用智能體平臺打造每個崗位專屬助手的時間已經(jīng)到了。

在這之前,星火已經(jīng)成功賦能了很多場景,無論是代碼、數(shù)字勞動力,還是評標、客戶、APP智能互動。科大訊飛與太平洋保險合作是從審計這個崗位做起的,包括客服和評標;此外,國家能源集團、中國石油等公司選了科大訊飛作為合作伙伴;同時,星火大模型賦能中國移動APP幾億用戶,使中國移動APP更加智能、交互更順暢。

通過這么多的場景可以看到,大模型賦能企業(yè)“人工智能+”行動有兩個方面:一方面是大模型直接完成任務(wù),訊飛星火一開始啟用,文本生成、語言理解、知識問答、邏輯推理和代碼能力對應(yīng)到下面相關(guān)的各種各樣的工具,它自己就完成了,不需要借助任何外力。

還有一種模式是以認知大模型為中心大腦,它調(diào)動各種專用模型,比如說振動的模型、味覺模型、氣體模型,濕度模型等各種模型,然后配合相應(yīng)的工具,再對接內(nèi)外部的各種信源和數(shù)據(jù),打通內(nèi)部的辦公OA、ERP系統(tǒng),再對接外部實時性來聯(lián)合完成任務(wù),相當于用大模型來指揮調(diào)度一系列的能力,從而完成一個綜合的任務(wù)。

面向B端,從劉慶峰闡述來看,訊飛星火大模型在“最后一公里”用智能體平臺打造專屬于每個崗位的工作助手,在智能家電、智能汽車、運營商、機器人等行業(yè)場景實現(xiàn)全面賦能,甚至成為各行各業(yè)創(chuàng)新發(fā)展的重要驅(qū)動力。

面向具身智能和人形機器人企業(yè)需求,目前400+機器人企業(yè)已經(jīng)采用訊飛機器人超腦平臺。另外,星火企業(yè)智能體平臺將圍繞智能體關(guān)鍵能力,覆蓋400+AI原子能力,集成 90+外部信源,打通100+內(nèi)部 IT 系統(tǒng),可供企業(yè)結(jié)合業(yè)務(wù)場景快速構(gòu)建可落地的智能體應(yīng)用。

“解決AI+行動的最后一公里的問題,是前所未有的機遇。”劉慶峰就表示,星火已經(jīng)成功賦能了很多場景,無論是代碼、數(shù)字勞動力,還是評標、客戶、APP智能互動。

不完全統(tǒng)計顯示,訊飛星火大模型正成為國家能源集團、中國石油、中國移動、中國人保、太平洋保險、交通銀行、海爾集團、美的集團等多領(lǐng)域頭部企業(yè)的首選。

公開招標網(wǎng)數(shù)據(jù)就顯示,今年上半年到6月中旬,整個公開招標數(shù)量約為234件。其中,60%以上的項目來自央國企。在央國企大模型訂單中標企業(yè)中,訊飛星火高居第一。

“我們能走多遠,取決于我們是否擁有自主開發(fā)的、可控的基礎(chǔ)能。”從劉慶峰表態(tài)來看,這是大模型如何解放生產(chǎn)力、釋放每個人、每家企業(yè),甚至每位開發(fā)者想象力的關(guān)鍵。

“合抱之木,生于毫末,九層之臺,起于壘土。”如同劉慶峰的說法,這正是大模型能力階段跨越的體現(xiàn)——意味著大模型從技術(shù)附加工具,轉(zhuǎn)向引領(lǐng)行業(yè)變革、助力企業(yè)降本增效、普惠大眾生活的關(guān)鍵階段。而針對更多商業(yè)化模式的探索,也正悄然形成“模型越強、落地越多、用戶越廣、算力越大”的增長飛輪。

從這個角度看,只要能做大生態(tài),加速產(chǎn)業(yè)最后一公里的落地,無論是大模型技術(shù)路線是閉源,還是開源,其實一點都不重要。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
大模型

相關(guān)文章

  • 通義靈碼AI編程能力再進化,說幾句話就能開發(fā)網(wǎng)頁

    9月19日,在2024杭州云棲大會上,隨著通義大模型能力的全面提升,阿里云通義靈碼迎來重磅升級,從一年前只能完成基礎(chǔ)的輔助編程任務(wù),進化到幾句話就能完成需求理解、任務(wù)拆解、代碼編寫、修改BUG、測試等開發(fā)任務(wù),最快幾分鐘可從0到1完成應(yīng)用開發(fā),提升數(shù)十倍開發(fā)效率。自去年首次亮相以來,通義靈碼已入職中

    標簽:
    通義千問
  • 何小鵬駕駛“全球首款A(yù)I汽車”亮相云棲大會 深化與阿里云AI算力合作

    9月19日,小鵬汽車董事長CEO何小鵬駕駛“全球首款A(yù)I汽車”P7+亮相2024云棲大會,這款車搭載了業(yè)內(nèi)領(lǐng)先的端到端大模型。過去2年,小鵬汽車與阿里云共建的AI算力規(guī)模提升超4倍。何小鵬表示,將繼續(xù)深化與阿里云的AI算力合作,加速推動端到端大模型拓展自動駕駛上限,提升下限。端到端是當下最受業(yè)界關(guān)注

  • 阿里CEO吳泳銘:機器人將是下一個迎來巨變的行業(yè)

    9月19日,阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘在2024云棲大會上發(fā)表主題演講。他認為,過去22個月,AI發(fā)展的速度超過任何歷史時期,但我們依然還處于AGI變革的早期。生成式AI最大的想象力,絕不是在手機屏幕上做一兩個新的超級app,而是接管數(shù)字世界,改變物理世界。阿里巴巴集團C

  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)

    標簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型

    標簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領(lǐng)產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當下機器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知

熱門排行

編輯推薦