當前位置:首頁 >  科技 >  互聯網 >  正文

IDC《2022中國大模型發(fā)展白皮書》,道出中國版ChatGPT甄別方式?

 2023-02-17 11:32  來源: A5專欄   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

文|智能相對論

作者|葉遠風

誰在跟風,誰又有真本事能做出中國版的對標產品來?

這恐怕是ChatGPT這股熱潮以來,關心中國AI發(fā)展的業(yè)界人士最想問的問題。

或者說,在中國人工智能不落后于全世界的當下,業(yè)界也在普遍渴望一個真正有實力的ChatGPT類產品出現。

但是,在一個人人都有那么點AI底子、能說出一些AI技術成果的今天,如果沒有專業(yè)的、系統(tǒng)的判斷標準,這個問題可能很難有答案——風潮下人人都像是跟風的,也都像是有能力的。

不過,IDC剛剛發(fā)布的一個關于大模型的報告,卻某種程度上“附帶”解決了這個問題。

在《2022中國大模型發(fā)展白皮書》中,面向大模型的發(fā)展,IDC在行業(yè)首次提出大模型評估框架,通過多維度標準,對行業(yè)主要大模型的發(fā)展狀況進行了系統(tǒng)化的判斷和評分。

當大模型能力的判斷有了較為權威的行業(yè)標準后,誰能做出真正的ChatGPT類產品,其實已經有了答案。

ChatGPT是AI的一大步, 但只是大模型的一小步

在問能不能之前,先要問是什么。

雖然ChatGPT的問世已經有數個月的時間,但對多數人尤其是行業(yè)外的“吃瓜群眾”而言,除了知道這是AI領域的一大突破外,對它究竟是什么并沒有深入地了解。

實際上,ChatGPT就是一種大規(guī)模語言模型(LLM Large Language Model),是大模型在NLP領域不斷發(fā)展的一種結果。

從技術角度看,目前大模型已經深入各個AI領域,如NLP、CV、科學計算等,但它最早發(fā)端于NLP,以谷歌的BERT、OpenAI的GPT和百度文心大模型為代表,參數規(guī)模逐步提升至千億、萬億,同時用于訓練的數據量級也顯著提升。

隨著“大本營”NLP領域大模型的不斷進化,最終OpenAI的GPT率先開出了ChatGPT這朵花。

所謂GPT,即Generative Pre-Trained Transformer,就是通過Transformer為基礎模型,使用預訓練技術得到通用的文本模型。

GPT家族已經先后擁有GPT-1,GPT-2,GPT-3,以及圖像預訓練iGPT等模型,ChatGPT本質就是GPT-3.5,只不過因為強大的對話能力突然爆火起來。不同的是,ChatGPT采用了新的指示學習(Instruction Learning)和人工反饋的強化學習(Reinforcement Learning from Human Feedback,RLHF)來指導模型的訓練,前者帶來了理解能力,后者增強了模型效果。

無論如何,大模型良好的通用性、泛化性,以及顯著降低人工智能應用門檻的優(yōu)勢,在ChatGPT上得到了淋漓盡致的展示。

從這個意義上看,任何NLP領域的大模型,在良好的發(fā)展之后,都會、都可以生長出自己的ChatGPT,或者,更專業(yè)的概念稱為ChatBot類產品。

“智能相對論”總結目前市面上領先的NLP大模型以及ChatBot產品如下:

從這個列表可以看出兩件事:

1、所有成型的ChatBot都只能是大模型發(fā)展的一種產品化結果,國外Google的Bard、國內百度的文心一言(ERNIE Bot)都是如此,其本質都是前期大模型家族的最新產品。

2、不管哪個ChatBot,能做得怎么樣,幾乎都取決于前期大模型家族的發(fā)展情況。

對大多數缺乏優(yōu)秀大模型基礎的廠商而言,要么必須花長周期重走一遍類似從“文心”到“文心一言”的路徑,要么就繞過大模型直接做ChatBot——其質量可想而知。

而判斷大模型家族的基礎究竟如何,IDC的報告剛好就起到了作用。

此次IDC為了充分評估大模型技術能力、功能豐富度與底層深度學習平臺開發(fā)能力,以及對各行業(yè)賦能的實際效果,并考慮到大模型的未來商業(yè)化前景,搭建起了大模型評估框架V1.0:

最終,IDC中國將大模型市場服務劃分成了L1-L5五個層級(層級越高,廠商在大模型市場梯隊越靠前),最終評價結果是當前大部分廠商能力處于L2-L3層級。其中,最為凸顯的是唯一處在第一梯隊的百度文心大模型,產品能力、生態(tài)能力達到L4水平,應用能力達到L3水平:

目前,被IDC高度評價的文心大模型已經建設了包括基礎大模型(NLP、CV、跨模態(tài))、任務大模型、行業(yè)大模型三大類在內的36個大模型。IDC認為,百度文心大模型在產品能力上呈現出較強技術實力和平臺積累,“文心大模型+深度學習平臺”創(chuàng)新了人工智能研發(fā)應用范式,滿足市場大規(guī)模落地需求,達到行業(yè)前端水平。

IDC中國副總裁兼首席分析師武連峰表示,“大模型的背后蘊藏著一場人工智能落地模式的變革。如今火爆全球的ChatGPT背后的技術支撐正是大模型。沒有對大模型的長期投入,就不會誕生ChatGPT這樣的應用。在IDC提出的大模型評估框架下,百度文心大模型在本次評估中表現非常突出,是其打造文心一言的堅實基礎。”

因此,國內已經宣布要做ChatGPT類產品的科技大廠中,能夠最終做出類ChatGPT產品的,可能還是只有擁有中國科技企業(yè)最成熟的大模型開發(fā)工具和產品體系的百度。

當然,這個結果并不意外,國內長期堅持在大模型領域投入的,百度就是其中一。

大模型評估框架下, ChatBot兩種發(fā)展路徑顯現

既然IDC以權威、系統(tǒng)的方式證明了國內(主要是百度文心、文心一言)有充分的推出ChatBot的大模型基礎能力,那么為什么最先走出來被廣泛關注到的還是ChatGPT?

如果從文心的發(fā)展與GPT的發(fā)展對比來看,大模型時代,ChatBot的兩種發(fā)展路徑的不同已經顯現出來。

早在2019年3月,百度就做出了文心 ERNIE 1.0,這一技術創(chuàng)新與“同類”GPT-1、BERT的差距都只有幾個月,且百度積累的大規(guī)模知識和海量多元數據,讓文心得以快速發(fā)展。

到了2021年,ERNIE 3.0大模型即擁有千億參數,后來ERNIE 3.0 Titan更是達到了2600億。

這個發(fā)展過程,百度也逐漸構建起一套包括文心大模型層、工具平臺層、產品與社區(qū)的三層體系,這就是IDC在報告中強調的,“模型+工具平臺+生態(tài)”三級協同加速產業(yè)智能化。

說白了,百度從一開始就在想著怎么讓文心大模型進產業(yè)、怎么落地獲得商業(yè)價值,也是按照這個“總綱”在走、在設計其整個體系。

最典型如,文心已累計發(fā)布11個行業(yè)大模型,在金融、能源、制造、城市、傳媒、互聯網等行業(yè)擁有實際落地的標桿案例,盯住的是解決客戶的實際痛點,把大模型能力應用到客戶業(yè)務流程關鍵環(huán)節(jié)中,求技術效果突破、求產品創(chuàng)新、求生產流程變革、求降本增效,等等。

在這些行業(yè)大模型往下,還有任務大模型、基礎大模型的全力支撐;再往上,又有工具、產品的落地轉化。

這種體系化面向產業(yè)的做法,一方面源于中國獨特的產業(yè)智能化需求的大背景,另一方面與百度將AI的發(fā)展更多地轉向現實產業(yè)價值有關。

如果說這種做法有什么后果,那就是集中B端落地、晦澀的技術和產品帶來的技術認知不足。

現在,大洋彼岸的ChatGPT突然搞出了“大新聞”,舉起了旗幟,文心基于此前的能力積累也能做出類ChatGPT的面向C端大眾的ChatBot產品文心一言,于是,這就成了百度彰顯自身技術能力的一個契機。

反過來看,ChatGPT則先面向C端做出了老少咸宜的大眾化可觸達產品,相似的技術底子下,聲量自然就更高。

毫無意外的是,在OpenAI的布局中,ChatGPT接下來也會嘗試走入更多垂直產業(yè)中發(fā)揮價值。

最終,兩種路徑都將殊途同歸,實現B、C的全覆蓋,只是所處階段不同而已。

技術層不可跟風也跟不了風, 但ChatBot產業(yè)應用卻值得廣泛嘗試

做ChatBot,在技術層面不應該跟風上馬,它只能是LLM的一種自然的結果。

用更直接的話說,如果認為ChatBot真的有用,想要造福自身業(yè)務或者惠及伙伴、客戶,更多缺乏基礎的科技大廠應該沉下心來做這件事,而不是大干快上、急著表態(tài)。

跟風哄抬股價、刺激關注并不可取,最終欺騙的是投資者和關心企業(yè)的人。

不過,在這股風潮中,于產業(yè)方而言,卻并不存在什么跟風不跟風。

作為AI領域好不容易等來的確確實實可能改變價值認知的產品,ChatBot在任何產業(yè)都值得嘗試,只要有益于業(yè)務都可以探索這股AI的全新力量。

之前,在ChatGPT被歸入的AIGC(生成式AI)場景下,百度文心已經有大量的產業(yè)實踐。

例如,ERNIE 3.0文本理解與創(chuàng)作API,覆蓋寫作文、摘要、文案、小說、對聯等多項生成能力,每天服務上萬用戶;而基于文心大模型的智能視頻合成平臺則讓用戶在一鍵輸入新聞圖文內容鏈接后,就可以自動化完成視頻制作,這些都大大提升了內容創(chuàng)造的效率和質量。

在文心一言推出后,已有攜程、汽車之家、愛藝奇、大量媒體機構等宣布接入。

最近,百度方面還宣布,未來會推出生態(tài)合作計劃,要吸引和支持更多伙伴加入進來,一起拓展覆蓋范圍更廣的商業(yè)市場。

在熱烈的預期之下,真實的產業(yè)成果正在被探索、走向落地。

值得一提的是,作為基于百度智能云技術打造出來的大模型,文心一言未來也將通過百度智能云對外提供服務,為產業(yè)帶來真正的AI普惠,這也將根本性地改變云市場的游戲規(guī)則。之前選擇云廠商更多看算力、存儲等基礎云服務,以后用戶對云廠商的需求更加聚焦智能服務,會更多關注模型、框架、芯片以及應用,這四層架構之間的協同。云服務正從數字時代躍遷到智能時代,智能化對各行各業(yè)效率的提升將顯著顯現。

正如IDC所言,各行業(yè)技術買家都應該盡早擁抱大模型,利用大模型進行降本增效、產品革新,“越早開始將大模型與自身行業(yè)、任務相結合,模型與技術之間才有更多的時間進行打磨優(yōu)化,在未來大模型深入各行各業(yè)的時候才能擁有話語權”。

除了“看熱鬧”,想要在ChatGPT帶來的風潮中抓住商業(yè)機會的企業(yè),以及對ChatBot真正有需求的產業(yè)主體,都應該行動起來了。

*本文圖片均來源于網絡

此內容為【智能相對論】原創(chuàng),

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯系。

•AI產業(yè)新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能 十萬個為什么》

•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
chatgpt

相關文章

  • 育兒顧問大模型KidsGPT,能成為孩子王的新故事嗎?

    大模型混戰(zhàn),參與者又多了一員。61兒童節(jié)當天,主營母嬰童商品零售與增值服務的孩子王重磅上線“AI育兒顧問大模型”一一KidsGPT,旨在為6000萬會員提供更高維、更新穎的數字化體驗。據節(jié)點財經了解,KidsGPT為孩子王自研的大模型,經過對育兒、教育等方面系統(tǒng)的垂類數據訓練和大量內測,已實現智能對

    標簽:
    chatgpt
  • ChatGPT引領賣家在跨境電商平臺的智能革命

    導語:隨著人工智能的迅速發(fā)展,ChatGPT的應用正以驚人的速度滲透到各個行業(yè)。其中,在跨境電商平臺上,ChatGPT作為一種智能助手,為賣家?guī)砹饲八从械睦?。本文將深入探討ChatGPT在跨境電商中的應用,以及如何將其融合在店鋪管理操作中,為賣家?guī)頍o限商機。智能客服與溝通:ChatGPT作為

    標簽:
    chatgpt
    跨境電商
  • 邁特AI助手ChatGpt源碼安裝部署詳細文檔

    邁特AI助手ChatGpt源碼安裝部署詳細文檔:1、所需環(huán)境服務器建議:centos7.4以上,安裝寶塔運行環(huán)境:LNMP軟件版本:php7.4+mysql5.7php拓展安裝:fileinfo、2、安裝寶塔自行去安裝1、數據庫配置這里改為自己的數據庫賬號密碼。4、偽靜態(tài)配置打開寶塔偽靜態(tài)內容loc

    標簽:
    chatgpt
  • ChatGPT喚醒AI游戲?

    “七天制作新游戲”、“AI全自動完成所有游戲!”......繼各種AI繪畫、AI合成照片、視頻之后,AI在游戲領域開啟了新一場狂歡。長久以來,游戲和AI一直有著“相互扶持”的親密關系——一邊是游戲充當AI科研基地,正向拉動AI技術進步;一邊是AI定位為先進的技術工具,為游戲體驗帶來更多可能性。如今,

    標簽:
    chatgpt
  • 空間智能化的速度,連ChatGPT都低估了

    如果人可以快速地適應空間,同時空間也可以根據人的行為做出反應,到底會擦出什么樣的火花?過去相當長一段時間里,諸如此類的話題可能僅限在設計師的圈子里討論??僧斨悄茉O備越來越流行,用戶需求逐漸從PC、手機延伸到整個生活空間,交互已然成為人感知空間智能進化的起點。人們需要什么樣的空間體驗,怎么去獲取智能化

    標簽:
    chatgpt

熱門排行

信息推薦