1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 大數(shù)據(jù)
  4. 正文

“多云多模型”時代到來,火山引擎的數(shù)字化升級“刀法”

 2023-04-24 18:06  來源:A5專欄  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

2023年,幾乎可以被定義為中國互聯(lián)網(wǎng)公司的“大模型元年”。

ChatGPT的全球爆紅,徹底點燃國內(nèi)的大模型賽道,曾經(jīng)的“創(chuàng)業(yè)英雄”、如今的商業(yè)領(lǐng)袖們親自下場,接連發(fā)布生成式人工智能產(chǎn)品與大模型布局。

大模型火了,沉寂許久的互聯(lián)網(wǎng)行業(yè)又有了新的“戰(zhàn)事”。同時,大模型的快速發(fā)展也改變了云市場的現(xiàn)狀,企業(yè)對算力的需求急劇增長,技術(shù)層面從單一云架構(gòu)向“多云架構(gòu)”轉(zhuǎn)變的趨勢日益顯著。

2022年,字節(jié)跳動旗下云服務(wù)品牌“火山引擎”對4000多家在云上消耗超過100萬的企業(yè)客戶進行調(diào)研,他們發(fā)現(xiàn),目前有88%的企業(yè)采用多云架構(gòu),平均每家企業(yè)會使用“五朵云”。

在多云架構(gòu)趨勢與大模型持續(xù)迭代的背景下,火山引擎總裁譚待認(rèn)為,未來將是“多云多模型”的時代。

不難理解,如今國內(nèi)云服務(wù)市場呈現(xiàn)多元化趨勢,企業(yè)從不同廠商采買云服務(wù)已是常態(tài),而大模型也不會一家獨大,最終會形成多模型共生甚至協(xié)作的生態(tài)。

“在多云方面的實踐,字節(jié)可以說是經(jīng)驗最豐富的一家。”譚待說。

具體到技術(shù)與業(yè)務(wù)層面,在“多云多模型”時代下,火山引擎如何為企業(yè)提供針對性的解決方案?

做好大模型的“基礎(chǔ)設(shè)施”

大模型是人人都想摘得的“玫瑰枝”,但在國內(nèi)落地實現(xiàn)的壁壘依然很高。

大模型的訓(xùn)練與迭代是對算力和數(shù)據(jù)的雙重考驗,也是對企業(yè)資金儲備與戰(zhàn)略定力的挑戰(zhàn);有業(yè)內(nèi)人士估算過,OpenAI 訓(xùn)練 GPT-3 一年,算力成本就高達 2000 萬美元。

尤其對中小科技企業(yè)或初創(chuàng)公司而言,建設(shè)大模型更具體的挑戰(zhàn)在于,企業(yè)缺乏足夠的應(yīng)用場景實踐和行為分析數(shù)據(jù),在訓(xùn)練和迭代升級上也存在壁壘。

譚待也認(rèn)為,國內(nèi)很多科技公司投入到大模型建設(shè)中,他們有優(yōu)秀的技術(shù)團隊、豐富的行業(yè)知識和創(chuàng)新想法,但往往缺乏經(jīng)過大規(guī)模場景實踐的系統(tǒng)工程能力。

對此,火山引擎的解法是:為大模型客戶提供高穩(wěn)定性和高性價比的AI基礎(chǔ)設(shè)施。

如何為大模型提供基礎(chǔ)設(shè)施?據(jù)譚待透露,國內(nèi)大模型領(lǐng)域七成以上企業(yè)是火山引擎客戶,火山引擎將為他們提供關(guān)鍵的算力支持和技術(shù)平臺,并為消費者帶來更豐富的AI應(yīng)用。

具體到產(chǎn)品端,近日,火山引擎發(fā)布新版機器學(xué)習(xí)平臺:支持萬卡大模型訓(xùn)練、微秒級延遲網(wǎng)絡(luò),讓大模型訓(xùn)練更穩(wěn)更快。

同時,火山引擎發(fā)布了基于自研DPU的Intel CPU計算實例、AMD CPU計算實例、NVIDIA GPU計算實例,以其中“DPU+AMD Genoa CPU平臺的計算實例”為例,整機性能最高提升138%,單核性能最高提升39%。

算力是實現(xiàn)大模型迭代的關(guān)鍵一環(huán),而火山引擎通過與字節(jié)跳動國內(nèi)業(yè)務(wù)并池,將抖音等業(yè)務(wù)的空閑計算資源極速調(diào)度給火山引擎客戶使用,確保企業(yè)在大模型建設(shè)中的數(shù)據(jù)支持與算力保障。

字節(jié)跳動副總裁楊震原表示,“并池”意味著可以調(diào)度一些資源,去錯峰互用,把運力提上去,“比如其實也有波峰和波谷,凌晨用的人少,這種資源就很適合科學(xué)計算的能力。”

字節(jié)跳動副總裁楊震原分享抖音的機器學(xué)習(xí)實踐

基于字節(jié)系的算力資源和生態(tài)能力,火山引擎所提供的大模型基礎(chǔ)設(shè)施,在運算效率和性價比方面更有優(yōu)勢。

以火山引擎的合作客戶MiniMax為例,這是一家已經(jīng)推出自研大模型產(chǎn)品的獨角獸公司,其與火山引擎合作建立的超大規(guī)模推理平臺,擁有萬卡級算力池,支撐單日過億次調(diào)用。

再比如抖音的推薦系統(tǒng),在火山引擎的算力支持下,工程師用15個月的樣本訓(xùn)練某個模型,5小時就能完成訓(xùn)練,成本只有5000元。

“火爆全網(wǎng)的抖音’AI繪畫’特效,從啟動到上線只用一周多,模型由一名算法工程師完成訓(xùn)練。”楊震原介紹說。

楊震原還認(rèn)為,業(yè)務(wù)創(chuàng)新需要試錯,試錯要大膽、敏捷,但試錯也一定要控制成本。

效率更優(yōu)、算力資源豐富、成本可控的大模型訓(xùn)練與迭代方式,往往是初創(chuàng)型科技公司最為看重的模式,也是火山引擎努力實現(xiàn)的目標(biāo)。

譚待指出,火山引擎要服務(wù)好那些立志做好大模型的公司,為其提供基礎(chǔ)算力支持和技術(shù)平臺。“如何在工程上幫它們優(yōu)化,提高效率,穩(wěn)定性,都是我們關(guān)注的重點。”

當(dāng)然,不同企業(yè)在不同應(yīng)用場景下,對云服務(wù)和大模型的需求千差萬別,火山引擎又如何做好個性化的企業(yè)級解決方案?

數(shù)據(jù)驅(qū)動,升級企業(yè)解決方案

從2020年成立至今,火山引擎基于內(nèi)部業(yè)務(wù)的技術(shù)生態(tài),已經(jīng)向外開放機器翻譯、視覺智能等能力,業(yè)務(wù)覆蓋金融、汽車、消費、文娛等行業(yè)場景。

不過,事情正在起變化,“多云多模型”時代對云廠商提出更復(fù)雜的挑戰(zhàn)。

一方面,企業(yè)加速搭建“多云架構(gòu)”,以實現(xiàn)算力的快速增長;另一方面,多模型意味著多場景應(yīng)用,企業(yè)在不同的業(yè)務(wù)場景中需要差異化的AI應(yīng)用。

早在2022年,火山引擎就提出“體驗創(chuàng)新、數(shù)據(jù)驅(qū)動、敏捷迭代”的云上增長三要素,基于企業(yè)不同的應(yīng)用場景,利用數(shù)據(jù)驅(qū)動搭建云增長模型。

譚待認(rèn)為,“過去很多企業(yè)花費了大量時間構(gòu)建數(shù)據(jù)中臺,但最后失敗了,找不到數(shù)據(jù)應(yīng)用的場景,價值也沒有發(fā)揮出來。其本質(zhì)在于,企業(yè)沒有將數(shù)據(jù)驅(qū)動整個體系設(shè)計好。”

火山引擎總裁譚待宣布支持“多云多模型”的未來架構(gòu)

火山引擎非常看重數(shù)據(jù)驅(qū)動為企業(yè)降本增效、技術(shù)升級所帶來的作用,內(nèi)部對數(shù)據(jù)使用的價值也有一個明確標(biāo)準(zhǔn)——“0987”,即零事故、滿足90%的需求、80%的需求能夠通過技術(shù)優(yōu)化實現(xiàn)秒級調(diào)用、通過業(yè)務(wù)部門評價達到70分以上。

堅持以數(shù)據(jù)驅(qū)動為增長核心,火山引擎能在內(nèi)容、營銷等領(lǐng)域提供更多個性化的企業(yè)級應(yīng)用,比如在內(nèi)容領(lǐng)域通過算法和AI平臺幫助創(chuàng)作更優(yōu)質(zhì)內(nèi)容、在內(nèi)部運營方面通過數(shù)據(jù)平臺優(yōu)化供應(yīng)鏈和庫存管理等。

如今,火山引擎的解決方案已經(jīng)在各行各業(yè)落地,進一步帶動產(chǎn)業(yè)的數(shù)字化升級。

2022年卡塔爾世界杯期間,火山引擎就用AI的方式做出窄帶高清,一方面提升視頻幀率,另外還能降低帶寬。

同時,針對網(wǎng)絡(luò)觀眾收看比賽最頭疼的直播延時問題,火山引擎通過RTM超低時延直播技術(shù),將直播畫面的端到端延遲最低降到1s,電視觀眾和網(wǎng)絡(luò)觀眾幾乎都能“同頻”觀看賽事直播。

此外,在公益領(lǐng)域,火山引擎與字節(jié)跳動公益將聯(lián)合推出公益版的電子票據(jù)服務(wù)與公有云服務(wù),為符合條件的公益組織提供為期3年的免費服務(wù)。

據(jù)地歌網(wǎng)了解,字節(jié)跳動公益電子票據(jù)服務(wù)已于今年2月上線,目前中華社會救助基金會、中國聽力醫(yī)學(xué)發(fā)展基金會已申請使用該服務(wù)。

中華社會救助基金會相關(guān)負(fù)責(zé)人表示,該基金會2022年開票量超過1萬張,電子開票可以節(jié)約0.5個財務(wù)人力成本。

從直播體驗升級到公益票據(jù)服務(wù),火山引擎通過數(shù)據(jù)驅(qū)動,努力在不同行業(yè)的不同業(yè)務(wù)場景中落地數(shù)字化應(yīng)用。

火山引擎所處的云計算領(lǐng)域是大市場,專業(yè)機構(gòu)估算,國內(nèi)云計算市場規(guī)模預(yù)計在今年突破3000億元。

但,“多云多模型”時代逐步變?yōu)楝F(xiàn)實,企業(yè)對云服務(wù)的差異化能力提出更高要求,并且需要將云計算與大模型賦能到實際業(yè)務(wù)中,帶來整體業(yè)務(wù)升級。

行業(yè)正在起變化,云計算企業(yè)“不得不變”。

在海外,亞馬遜AWS于日前為企業(yè)客戶推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分類、開放式問答和信息提取等任務(wù)的生成式大語言模型等。

在國內(nèi),云計算領(lǐng)域競爭激烈,阿里云、華為云等均在行業(yè)內(nèi)深耕多年,火山引擎作為“后發(fā)之人”,依托于字節(jié)生態(tài)“溢出”的2B能力,持續(xù)升級企業(yè)數(shù)字化解決方案。

當(dāng)然,為適應(yīng)“多云多模型”時代,為大模型客戶提供AI基礎(chǔ)設(shè)施,火山引擎有著“任重道遠”的目標(biāo)。好在,基于多年的資源儲備和場景實踐,火山引擎已經(jīng)摸索出了一條自己的云增長道路。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標(biāo)簽
數(shù)字化技術(shù)

相關(guān)文章

熱門排行

編輯推薦