當(dāng)前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

怎么向大模型要生產(chǎn)力,訊飛星火的“三問三答”

 2024-04-01 13:30  來源: A5專欄   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競價(jià),好“米”不錯(cuò)過

埃弗雷特·羅杰斯在《創(chuàng)新與擴(kuò)散》中提出過一個(gè)著名觀點(diǎn):一種創(chuàng)新在剛起步時(shí)接受程度比較低,使用人數(shù)較少,擴(kuò)散過程也就相對遲緩,當(dāng)使用者比例達(dá)到臨界值后,創(chuàng)新擴(kuò)散過程就會(huì)快速地增加。

風(fēng)頭正盛的大模型浪潮,再次印證了創(chuàng)新擴(kuò)散理論的適用性:三年前還只有少數(shù)幾個(gè)科技大廠參與,價(jià)值被初步驗(yàn)證的2023年,即上演了“百模大戰(zhàn)”的一幕,2024年大概率是大模型落地應(yīng)用的元年,向千行萬業(yè)加速擴(kuò)散。

由此產(chǎn)生的一個(gè)問題是:怎么將大模型的能力延伸到產(chǎn)業(yè)一線,最適合中國產(chǎn)業(yè)結(jié)構(gòu)的路徑是什么?

半個(gè)多月前的華為中國合作伙伴大會(huì)2024上,科大訊飛副總裁劉江參與了“計(jì)算峰會(huì)”的討論,圍繞大模型落地應(yīng)用的路線、場景和生態(tài),分享了訊飛星火在過去一年時(shí)間里的探索和答案。

01 大模型的能力從何而來?

盡管不同統(tǒng)計(jì)口徑下的數(shù)據(jù)有所差別,但可以肯定的是,目前國內(nèi)的大模型數(shù)量已經(jīng)有上百個(gè),用“遍地都是”來形容大模型行業(yè),并不算夸張。問題在于,為什么大模型的數(shù)量越來越多,產(chǎn)業(yè)應(yīng)用尚未渡過拐點(diǎn)?

大模型的行業(yè)競爭,從來都不是拼數(shù)量的游戲,經(jīng)過一段時(shí)間的跟風(fēng)、躁動(dòng)后,還是要回到能力上。

2024年1月30日,訊飛星火正式升級到V3.5版本,在語言理解、文本生成、知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力和多模態(tài)能力七個(gè)方面進(jìn)行了全面升級,其中語言理解、數(shù)學(xué)能力超過GPT-4 Turbo,代碼達(dá)到GPT-4 Turbo的96%,多模態(tài)理解達(dá)到GPT-4V的91%。

同期發(fā)布的星火語音大模型,在中文、英語、法語、俄語等首批37個(gè)主流語種的語音識別效果超過OpenAI的Whisper V3,而在多語種語音合成方面,星火語音大模型的首批40個(gè)語種平均MOS分絕對提升了0.25,擬人度超過83%,均達(dá)到了國際領(lǐng)先水平。

訊飛星火認(rèn)知大模型在“百模大戰(zhàn)”中脫穎而出的背后,離不開昇騰AI和科大訊飛在算力底座上的聯(lián)合突破。

時(shí)間回到2023年4月,訊飛星火V1.0發(fā)布前夕。有別于一些大模型廠商搶時(shí)間上線的做法,科大訊飛在同步思考一個(gè)長遠(yuǎn)問題:為了避免被卡脖子,怎么將大模型的能力架構(gòu)在一個(gè)自主創(chuàng)新的體系上?

接下來近一年的時(shí)間里,昇騰AI和科大訊飛針對大模型訓(xùn)練進(jìn)行了一系列技術(shù)攻關(guān),包括大模型底層算子庫開發(fā)和優(yōu)化、大模型算法遷移、超大規(guī)模集群智能化運(yùn)維軟件開發(fā)等等。

雙方聯(lián)合開發(fā)和優(yōu)化了50多個(gè)大模型算子,其中科大訊飛基于昇騰自主開發(fā)自定義的關(guān)鍵算子就超過10個(gè),最終讓大模型的訓(xùn)練性能提升了3倍以上,和國外同類產(chǎn)品不相上下。

6個(gè)月后的訊飛開發(fā)者節(jié)上,雙方向外界公布了一個(gè)新消息:首個(gè)支撐萬億參數(shù)大模型訓(xùn)練的國產(chǎn)算力平臺(tái)“飛星一號”正式啟用,基于昇騰AI基礎(chǔ)軟硬件平臺(tái)和大容量交換機(jī)構(gòu)建參數(shù)面無損ROCE組網(wǎng),配置高空間的全閃和混閃并行文件系統(tǒng),可以支撐萬億參數(shù)大模型高速訓(xùn)練。

解決了大模型的算力底座后,聯(lián)合創(chuàng)新的勢能被進(jìn)一步釋放,先后訓(xùn)練出了訊飛星火V3.5、星火語音大模型、星火開源大模型以及12個(gè)行業(yè)大模型,為大模型的能力提升注入了源源不斷的動(dòng)力。

02 大模型的能力怎么輸出?

大模型的能力不能停留在參數(shù)上,停留在評測報(bào)告中,想要解放生產(chǎn)力,前提是讓大模型的能力落到一個(gè)個(gè)業(yè)務(wù)場景中。由此產(chǎn)生的關(guān)鍵問題是:大模型的能力怎么輸出,怎么降低落地門檻?

經(jīng)過一年多的摸索后,行業(yè)上下游逐漸形成了一種共識,即通過預(yù)訓(xùn)練產(chǎn)生通用大模型,再在通用大模型的基礎(chǔ)上,使用特定的行業(yè)數(shù)據(jù)精調(diào)出行業(yè)大模型,然后基于通用大模型或行業(yè)大模型來開發(fā)應(yīng)用。

訊飛星火遵循了大模型落地的行業(yè)共識。有所不同的是,訊飛星火還提供了一條條通往產(chǎn)業(yè)一線的路。

為了滿足不同規(guī)模不同場景的快速部署需求,訊飛星火在“飛星一號”的基礎(chǔ)上,進(jìn)一步開放了底層算力構(gòu)建和運(yùn)維能力、大模型訓(xùn)練平臺(tái)和工具鏈,以及數(shù)據(jù)清洗、數(shù)據(jù)訓(xùn)練、應(yīng)用開發(fā)等全套工具,讓企業(yè)可以構(gòu)建自己的智算底座。

為了滿足企業(yè)專有大模型的推理應(yīng)用需求,科大訊飛和華為在2023年8月發(fā)布了“星火一體機(jī)”,提供底層算力、AI框架、訓(xùn)練算法、推理能力、應(yīng)用成效等AI能力,讓每家企業(yè)或機(jī)構(gòu)都能獲得“開箱即用”的大模型一體化解決方案。

為了加速企業(yè)大模型應(yīng)用價(jià)值的落地,科大訊飛的答案是星火優(yōu)化套件,包含星火通用大模型、行業(yè)大模型優(yōu)化套件和場景應(yīng)用優(yōu)化套件,并未局限在模型和算力層面,而是嘗試在配套服務(wù)和能力上打通大模型落地的“最后一公里”。

回到創(chuàng)新擴(kuò)散理論的話題上,創(chuàng)新擴(kuò)散的過程離不開千千萬萬的開發(fā)者,他們無疑是大模型走進(jìn)千行萬業(yè)的“螞蟻雄兵”。特別是整個(gè)行業(yè)還處于“摸著石頭過河”的階段時(shí),“獨(dú)角戲”注定不是可行的方式。

所以,訊飛星火在幫助企業(yè)和機(jī)構(gòu)降門檻的同時(shí),不斷向開發(fā)者拋出橄欖枝,不斷拉近開發(fā)者和大模型的距離。

比如訊飛星火在昇思社區(qū)等平臺(tái)上開源了13B大模型,并向開發(fā)者提供基礎(chǔ)模型、精調(diào)模型、微調(diào)工具、人格定制工具、高質(zhì)量多語種語料等等,通過給開發(fā)者提供全生命周期的服務(wù),讓他們把精力聚焦在想要解決的問題上,做最大的投入和努力,而非把時(shí)間花在不必要的事務(wù)中。

簡單做個(gè)總結(jié)的話,訊飛星火的路線并不復(fù)雜:一方面降低大模型的門檻,涵蓋訓(xùn)練、推理、部署等環(huán)節(jié);另一方面為開發(fā)者賦能,讓他們參與到大模型落地應(yīng)用的浪潮中。初衷則是借助合理的分工,跑通大模型價(jià)值釋放的產(chǎn)業(yè)鏈條,讓大模型不再是美好卻空洞的花瓶,而是實(shí)實(shí)在在的生產(chǎn)力。

03 大模型落地到哪些場景?

大模型的落地又不能一味求快。很多行業(yè)對大模型的態(tài)度仍是技術(shù)上的新鮮感,勢必要有一個(gè)價(jià)值持續(xù)驗(yàn)證的過程,落地到哪些場景,帶來什么樣的價(jià)值,直接影響著外界對新生產(chǎn)力的認(rèn)知。

就像瓦特在改良蒸汽機(jī)后,沒有預(yù)想中那樣迅速在全世界鋪開,而是經(jīng)歷了近半個(gè)世紀(jì)的探索,直到在紡織領(lǐng)域“打敗”水能,才讓蒸汽機(jī)和產(chǎn)業(yè)革命掛鉤。每一次工業(yè)革命的出現(xiàn),與其說是技術(shù)課題,不如說是一個(gè)經(jīng)濟(jì)課題。

同樣的問題也擺在大模型面前,成為新一輪工業(yè)革命“引擎”的前提,是產(chǎn)生肉眼可見的經(jīng)濟(jì)效益。

科大訊飛在2023年7月打造了一支名為“星火軍團(tuán)”的精銳隊(duì)伍,被定義為探索大模型價(jià)值落地的戰(zhàn)略業(yè)務(wù)組織。歷經(jīng)9個(gè)月的穩(wěn)扎穩(wěn)打,星火大認(rèn)知模型帶來的生產(chǎn)力變革正在被越來越多的行業(yè)認(rèn)可。

在能源領(lǐng)域,國家能源集團(tuán)與科大訊飛聯(lián)手開啟了能源行業(yè)數(shù)字化、智能化轉(zhuǎn)型的新篇章。

在智慧城市領(lǐng)域,湖北省利川市依托訊飛星火認(rèn)知大模型和昇騰算力,構(gòu)建了自主創(chuàng)新人工智能公共算力平臺(tái),驅(qū)動(dòng)利川數(shù)字產(chǎn)業(yè)、智慧文旅、康養(yǎng)產(chǎn)業(yè)、智慧農(nóng)業(yè)等領(lǐng)域全面發(fā)展。

其中利川文旅大模型發(fā)布將在今年五一正式上線使用,將從旅游線路規(guī)劃、旅客需求收集、客流高峰控制等方面,為景區(qū)的精細(xì)化管理提供科學(xué)高效的輔助決策,推動(dòng)文化和旅游深度融合、一體化發(fā)展。

在科研領(lǐng)域,中科院文獻(xiàn)情報(bào)中心與科大訊飛合作推出的星火科研助手,提供成果調(diào)研、論文研讀和學(xué)術(shù)寫作三大功能;三亞崖州灣科技城借助科研助手增強(qiáng)科研文獻(xiàn)檢索和分析能力,并通過科技文獻(xiàn)大模型為科研人員提供建議指導(dǎo),提高了研究效率和質(zhì)量。

在銀行領(lǐng)域,與某國有銀行強(qiáng)強(qiáng)聯(lián)合,實(shí)現(xiàn)訊飛星火在客服、展業(yè)、辦公、研發(fā)等場景的賦能,并正在重點(diǎn)打造銀行領(lǐng)域的代碼能力應(yīng)用標(biāo)桿。

在教育領(lǐng)域,謙萃智能利用iFlyCode智能編程助手為教師提供了高效的備課支持,簡化課程內(nèi)容,使學(xué)生更易于理解和掌握。在團(tuán)隊(duì)協(xié)作的項(xiàng)目中,iFlyCode顯著減少了所需的人力和時(shí)間資源。這些綜合效果共同促進(jìn)了教育資源的優(yōu)化配置和學(xué)習(xí)效率的整體提升,得到了師生們的廣泛認(rèn)可。

諸如此類的案例還有很多。需要說明的是,以上只是訊飛星火示范的標(biāo)志性應(yīng)用場景,目的是幫助企業(yè)探索大模型在B端的商業(yè)化之路,讓千行萬業(yè)看見大模型的價(jià)值所在。

在訊飛開放平臺(tái)上,生態(tài)開發(fā)者團(tuán)隊(duì)609.5萬,其中大模型直接開發(fā)者的數(shù)量41萬,他們才是點(diǎn)燃大模型落地應(yīng)用的星星之火,不斷將大模型的能力帶入到實(shí)際工作中,不斷拓寬大模型應(yīng)用的邊界。

04 寫在最后

大模型的產(chǎn)業(yè)之路還很長,昇騰AI和訊飛星火的合作,無疑為外界提供了一種值得借鑒的范式:在算力等基礎(chǔ)設(shè)施上打破大模型訓(xùn)練的瓶頸,為大模型的能力輸出開辟出一條條可行的路,然后由開發(fā)者們創(chuàng)造無數(shù)個(gè)解決問題的應(yīng)用。

有理由相信,沿著這樣已經(jīng)被證實(shí)的路徑走下去,持續(xù)做好應(yīng)用落地,形成數(shù)據(jù)飛輪,同時(shí)在大模型層面進(jìn)行可持續(xù)迭代和進(jìn)化,終將會(huì)渡過大模型產(chǎn)業(yè)應(yīng)用的“拐點(diǎn)”,帶來百倍、千倍的需求,營造出充滿生機(jī)的大模型產(chǎn)業(yè)生態(tài)。

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

熱門排行

信息推薦