大模型研發(fā)席卷全球,“百模大戰(zhàn)”目前已經(jīng)走到了搶占落地先手的階段。
2023年,從PC端到學習機,都在積極配合打造豐富的系統(tǒng)應(yīng)用場景,而手機作為和日常生活鏈接最為緊密的智能設(shè)備,與大模型的故事仿佛剛剛開始,大幕拉開,華為率先登場。
華為mate60自預(yù)告起就占盡先手,但此后,小米迅速推出了自己的大模型,OPPO、vivo等手機廠商也陸續(xù)加入,智能設(shè)備廠商大模型之爭硝煙彌漫,“軍備競賽”儼然打響,新的市場將幾分天下?這場大模型的高端局,華為能否繼續(xù)一枝獨秀呢?
01 目前來說,落地才是硬道理
根據(jù)IDC本月發(fā)布的報告,2023年,全球智能手機市場出貨量預(yù)測將會低于12億部,同比下降1.1%;而中國市場的出貨量預(yù)計僅有2.83億部,同比也下降約1.1%。據(jù)Counterpoint的數(shù)據(jù),2023年第二季度,中國智能手機銷量更是創(chuàng)2014年以來第二季度最低水平,同比下降4%,而就算是“618”大促期間,國內(nèi)手機銷量也大不如前,同比下降8%。
所以,全球手機消費市場領(lǐng)域需求明顯不足,期待新的變革,大模型承擔著在5G和6G之間掀起新一輪周期的希望。
高通中國區(qū)研發(fā)負責人徐皓表示:“大模型進入終端是系統(tǒng)普及的必然過程,對大多數(shù)用戶或企業(yè)來說,能夠普及的、 有意義的應(yīng)用還是在終端。就像曾經(jīng)銀河系列巨型計算機,可以算出非常復(fù)雜的太空飛行軌跡,但真正對普通民眾有意義的還是個人電腦。”而手機作為滲透現(xiàn)代人生活最為深刻的智能設(shè)備,不得不說確實可以稱得上是大模型落地的最強終端。
反過來我們還可以反思一下手機市場疲軟的原因,除了宏觀經(jīng)濟的因素外,主要原因大概有兩點,產(chǎn)品迭代快但代際差別不大,以及手機性能提高,消費者更換周期變長。所以大模型這種程度的顛覆性變革,同目前手機市場消費疲軟的原因極為契合。我們有理由相信,以華為產(chǎn)品為先聲的手機大模型革命能夠為活力不足的消費電子市場帶來一場狂歡。
同時,進手機,是大模型開發(fā)企業(yè)的必由之路:是運營過程中大量節(jié)約成本,提高效率的必然選擇。
初期的ChatGPT等大模型的訓練是在云端進行的,參數(shù)眾多,甚至達到百億或千億級,訓練時需要眾多GPU提供算力,這種條件只有云端能提供,保 守估計每月算力成本就在1000萬美元上下。而一旦大模型訓練完成,進入到推理階段,企業(yè)就會對成本和安全有更多考慮。以大語言模型'為例,當有大量用戶涌入進行搜索時,成本將節(jié)節(jié)攀升,呈指數(shù)增長。此外,把推理任務(wù)分發(fā)出去不僅會逐漸降低成本,而且還可以提高處理效率,保護用戶隱私,促進生態(tài)維穩(wěn)。
但回到當前階段,大語言模型究竟可以在手機上發(fā)揮怎樣的價值還未可知,因為系統(tǒng)本身也在不斷演進 ,所以目前來說,落地才是硬道理。
由于一切乾坤未定,進步和調(diào)整的路徑都需要在實踐中進一步摸索,所以主要玩家身處大模型落地的初創(chuàng)期,要少談些未來,多走些實地。炒作概念,泡沫終將散去,只有先聚焦技術(shù)實現(xiàn),加速落地才能真正站穩(wěn)腳跟。
回到華為的問題上,現(xiàn)在切不可追究細節(jié),落地才是硬道理。盤古大模型的加入目前會提供一些諸如“摘要總結(jié)”、“信息檢索”、“智能翻譯”以及傳統(tǒng)的“語音撥打電話”、“語音查詢天氣”等服務(wù),雖有用戶反映未達到期待,但未來還是有相當改進空間的。
屆時到底哪個大語言模型更流行或者更有用,也要看具體的應(yīng)用場景。有可能是生成語言來回答問題、幫助用戶寫PPT、寫文檔、寫代碼、識別語言等等。所以盡快落地,摸索需求的方向和技術(shù)的邊界才是重點。
02 百模大戰(zhàn)搶到先手,華為做對了什么?
華為并不是第一個,也不是唯一一個嘗試將大模型裝進手機的玩家,如前文所述,OPPO、vivo、小米也都在嘗試推出自己的大模型手機,那么華為率先拉開二者相結(jié)合的序幕,到底做對了什么?
要解決這個問題,就要了解大模型進入手機的核心要點,從云到端,達到云端協(xié)同。
具體來說就是,大模型需要首先在云端進行訓練,通過大數(shù)據(jù)分析和算法優(yōu)化得到高效的模型架構(gòu)和參數(shù),再將其部署到端側(cè)設(shè)備中,以實現(xiàn)本地化、實時性的智能服務(wù)。同時,云端平臺還可以對終端設(shè)備進行遠程管理和監(jiān)控。
理論上過程順暢,但實現(xiàn)過程中要經(jīng)歷從模型設(shè)計、數(shù)據(jù)處理、硬件升級、通信能力、安全性和隱私保護等方面的全方位優(yōu)化和技術(shù)創(chuàng)新。
首先,把大模型縮小是最大的挑戰(zhàn)。
據(jù)報道,截止今年5月,我國超過10億參數(shù)規(guī)模的大模型約79個,而千億規(guī)模以上的只有幾個,其中就包括華為的盤古大模型。盤古L0層基礎(chǔ)大模型最大版本包含1000億參數(shù),預(yù)訓練使用了超3萬億tokens,將它放進手機,難度可以說是非常大了。
但需要注意的是,盤古大模型實際上分為了四個版本,分別是100億參數(shù)、380億參數(shù)、710億參數(shù)和1000億參數(shù)??紤]到手機的硬件性能和運行環(huán)境,鴻蒙4中搭載的,很有可能是100億參數(shù)版本的盤古大模型。
想在這100億的數(shù)據(jù)規(guī)模上,保障大模型的準確性、可靠性,可能嗎?
對于這個問題,華為有兩種可能的解決方案:首先一種,是直接將鴻蒙4中的大模型,變成一個看似通用的“專用”大模型,采取小而精的策略。因為在某些特定場景,預(yù)訓練數(shù)據(jù)的質(zhì)量和相關(guān)性,遠比其數(shù)量和范圍要重要得多。
而第二種方式,則是通過“壓縮”的方式,在不犧牲性能和精度的情況下,降低模型的參數(shù)。華為在該模型的訓練過程主要采用了昇騰絕對模型壓縮、參數(shù)量子化、模型蒸餾和知識蒸餾等技術(shù),讓這個模型不僅具備強大的計算能力,還能夠兼顧效率和速度。
其次,大模型從云端進入手機,對端測設(shè)備硬件基礎(chǔ)設(shè)施的要求也相應(yīng)提高,倒逼硬件升級。
將大模型裝進手機需要手機具備相應(yīng)的硬件支持,包括高性能的處理器、大容量的存儲空間、高內(nèi)存以及其他的硬件加速設(shè)備。
Mate 60 Pro所搭載的是麒麟9000S芯片。計算和推理及硬件加速設(shè)備方面,GPU Maleoon 910性能直逼英偉達A100,在AI芯片領(lǐng)域,其處理速度比業(yè)界同類產(chǎn)品快80%以上。華為輪值董事更是介紹到,Mate 60 Pro搭載的芯片幾乎是當前全球算力最強、訓練速度最快的。
空間方面,大模型需要大量的存儲空間來存儲模型本身以及處理數(shù)據(jù),Mate 60 Pro使麒麟9000s和儲存顆粒堆疊,雖然散熱條件受損,但儲存性能獲得直線提升,512G與1T的空間,為大模型的運行留出余地。
最為重要的是,這塊麒麟9000S芯片,極有可能是華為海思完全自主研發(fā),這就意味著,華為擁有一條世界領(lǐng)先的芯片生產(chǎn)線,不受到任何國家、企業(yè)的限制,擁有完全自主權(quán),為大模型手機的順利運營提供了最為堅實的基礎(chǔ)。
相應(yīng)的問題就是,硬件的提升必然帶來價格的提高,對于消費者來說并不友好。但23年手機市場數(shù)據(jù)表明,在消費電子市場整體疲軟的背景下,國內(nèi)市場600美元以上的高端機銷售額在第二季度逆勢增長23.1%。這就證明,高端機市場的需求還是相當旺盛。
03 大模型進手機的高端局,華為能一枝獨秀下去嗎?
雖然華為大模型手機已經(jīng)有了一定程度的進展,但要真正完成從云到端的跨越,并非一件容易的事,是各大產(chǎn)品、軟件開發(fā)公司的難題,也是科技部下一代人工智能重點重大國家課題。
從全產(chǎn)業(yè)鏈出發(fā),這件事情根本不是華為單打獨斗能夠拼出來的,要保持行業(yè)領(lǐng)先地位,就需要多個環(huán)節(jié)的通力協(xié)同合作。
模型設(shè)計及開發(fā)環(huán)節(jié),需要對其結(jié)構(gòu)、參數(shù)和訓練數(shù)據(jù)進行優(yōu)化和壓縮,盡力降低復(fù)雜度。訓練方法和算法優(yōu)化方面,需要高效的算法提高訓練效率,以針對具體的應(yīng)用場景隨機應(yīng)變以上環(huán)節(jié),華為的開發(fā)團隊還能夠自行完成,但數(shù)據(jù)收集與處理,硬件產(chǎn)品支持以及應(yīng)用場景的開發(fā)就一定會隨著大模型與手機結(jié)合的深入,逐漸需要與產(chǎn)業(yè)鏈不同環(huán)節(jié)進行深入合作了。
數(shù)據(jù)收集和處理的過程中,大量用于訓練和優(yōu)化模型的數(shù)據(jù)都必須進行收集、整理、標注和處理,這就要求不同的數(shù)據(jù)處理中心同時協(xié)作,提供優(yōu)質(zhì)數(shù)據(jù)服務(wù)。同時,模型的學習和運行過程中還需要相應(yīng)的算力服務(wù)作為支撐,涉及產(chǎn)業(yè)鏈上游的算力租賃公司。
同時,如果要使模型更小,就需要采用更高效的壓縮和優(yōu)化技術(shù),訓練和部署模型要求更強大的硬件支持,例如 GPU、TPU 芯片。這就要求同中芯國際等芯片廠家進行合作。
總之,將大模型縮小不僅需要技術(shù)上的支持,還需要各個環(huán)節(jié)的共同努力。只有通過合作、協(xié)作和創(chuàng)新,才能實現(xiàn)模型的縮小和優(yōu)化,并最終實現(xiàn)更好的應(yīng)用效果。
不僅把模型縮小的開發(fā)階段需要產(chǎn)業(yè)鏈各環(huán)節(jié)通力合作,后續(xù)大模型手機在應(yīng)用、發(fā)展階段更需要的是一個欣欣向榮,和諧互補的生態(tài)環(huán)境。
未來,在開發(fā)過程中大模型就需要與各行業(yè)公司進行深度合作,以便將手機設(shè)備與各種智能家居、辦公等場景深度融合。
應(yīng)用和發(fā)展階段,大模型手機需要一個良好的生態(tài)環(huán)境來促進其廣泛應(yīng)用和創(chuàng)新。這包括各種應(yīng)用軟件的開發(fā)與更新,以及軟件生態(tài)的共建共享。只有在這樣的生態(tài)環(huán)境下,搭載了外腦的智能終端才能充分發(fā)揮潛力,成為消費者的得力助手。
大模型手機在多元化創(chuàng)新領(lǐng)域具有豐富的想象空間。例如,妙鴨相機就是一個很好的例子,通過大模型手機,消費者可以輕松實現(xiàn)各種創(chuàng)意拍攝,豐富社交內(nèi)容。未來,隨著技術(shù)的不斷發(fā)展,大模型手機有望在更多領(lǐng)域帶來更多創(chuàng)新應(yīng)用。
此外,需要特別關(guān)注的是,這場云到端的較量,華為不僅不可一枝獨秀,盤古本身是否適合手機終端還是一個值得商榷的問題。華為官方曾宣布,盤古并非注重語言和互動的大模型,而是“不會寫詩,只做實事”,面向行業(yè),踐行“AI for industries”的典型。簡而言之,盤古大模型強調(diào)在細分場景的落地應(yīng)用,主要解決商業(yè)環(huán)境中低成本大規(guī)模定制的問題,和C端用戶日常使用場景能否成功磨合呢?目前還需要等待市場更完整的反饋。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!