當前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

誰在“操控”虛擬人?

 2023-10-17 09:55  來源: A5用戶投稿   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

©自象限原創(chuàng)

作者|程心

編輯|周游

大模型的風,吹動虛擬數(shù)字人廠商野蠻生長(以下統(tǒng)稱虛擬人)。

《虛擬數(shù)字人深度產(chǎn)業(yè)報告》預計,到2030年我國虛擬數(shù)字人整體市場規(guī)模將達到2700億元,其中,“服務型虛擬人”總規(guī)模也將超過950億元。

如同禿鷹盯上腐肉,嗅到萬億商機的各方勢力,都欲分一杯羹,這也直接導致了目前的虛擬人玩家格局陷入了“混戰(zhàn)”狀態(tài)。

「自象限」根據(jù)各方數(shù)據(jù)不完全統(tǒng)計,目前國內(nèi)虛擬數(shù)字人核心廠商約有6000家。而按天眼查的數(shù)據(jù)顯示,相關(guān)廠商數(shù)量甚至超過6萬家。

同時,隨著大模型(Large Model)的興起,虛擬人的產(chǎn)業(yè)格局也在發(fā)生深刻變化。

比如,虛擬人正在經(jīng)歷從制作流程降本到技術(shù)突破的關(guān)鍵階段,從大語言模型到多模態(tài)能力,讓虛擬人從展示突破到了實時互動,這意味著未來虛擬人可能只需要一個實時渲染的外觀,就能擁有十分逼真的溝通能力。技術(shù)門檻的降低,也會讓更多參與方加入到這個開拓中的市場。而狂奔半年后,百億個虛擬人也逐漸滲透進各行各業(yè),并逐步進入商業(yè)化階段。

也就是說,在廠商“混戰(zhàn)”的表面下,隱藏的不僅是巨大的商業(yè)利益,更是復雜的技術(shù)博弈。而牽動著虛擬人“木偶引線”的另一頭,操控者們的世界也在發(fā)生翻天覆地的變化。

千億市場,廠商“混戰(zhàn)”

如果說元宇宙時期的虛擬人已經(jīng)是一把大火,那大模型就相當于在這之上又烹上了一勺油。一瞬間,鋪天蓋地的數(shù)字人廠商涌來,將本就復雜的行業(yè)攪得愈發(fā)渾濁。

這其中,既包括從元宇宙時期就一直堅持虛擬數(shù)字人的廠商,也有依靠全棧技術(shù)優(yōu)勢輕松邁出第一步的大廠,更不乏聞風而來的換道廠商。

「自象限」初步了統(tǒng)計核心廠商的類型后發(fā)現(xiàn),這些廠商大致可以分為四類:

▲圖為自象限原創(chuàng),轉(zhuǎn)載請注明出處

第一類是互聯(lián)網(wǎng)大廠,如騰訊、百度、阿里、京東、網(wǎng)易等。這里面其實也分兩類,一類是騰訊、百度為代表,他們業(yè)務龐大,在面向To B的解決方案上,比如金融、文旅、汽車等場景,需要一個數(shù)字人形象來符合新的交互方式。對于這些企業(yè),數(shù)字人只是業(yè)務的一個補充。另一類則是網(wǎng)易為代表的,具有技術(shù)積累的企業(yè),由于網(wǎng)易在游戲建模、AI捏臉等方面豐富的探索和技術(shù)積累,讓他們需要通過虛擬人將這些沉淀的資源轉(zhuǎn)化。

第二類是原生廠商。這是較早布局數(shù)字人的一批廠商,如即構(gòu)科技、魔琺科技、硅基智能、風平智能、數(shù)字栩生、相芯科技等。這類廠商或?qū)儆谏弦徊ㄔ钪鎰?chuàng)業(yè)的“遺珠”,或?qū)儆谑袌鲈缙谝噪娚讨辈ж洝⒈镜厣钪辈サ葓鼍扒腥霐?shù)字人場景的公司,得益于AIGC技術(shù),其中的一些公司完成了從2D數(shù)字人到3D數(shù)字人的升級。

第三類是換道廠商。基于原有技術(shù)延伸入局數(shù)字人賽道,如:商湯、華為、科大訊飛、快手、360、美圖、蔚領(lǐng)時代、元境科技、新壹科技等。這類廠商在發(fā)展過程中積累了一些涉及數(shù)字人的技術(shù)。譬如商湯的視覺識別技術(shù)、科大訊飛的語言識別技術(shù)、蔚領(lǐng)時代的游戲渲染技術(shù)等等,以這些技術(shù)為突破口再結(jié)合大模型的發(fā)展,完成了賽道的轉(zhuǎn)換。

第四類是跨界廠商。他們因為自身業(yè)務場景需求而下探數(shù)字人技術(shù),如萬興科技、藍色光標、謙尋、高途、中公教育等。這類廠商的特點是其原本業(yè)務與數(shù)字人并無太大交集,如萬興科技主營業(yè)務是提供文圖、剪輯類的基礎工具,衍生出為客戶提供數(shù)字人工具;藍色光標的主要業(yè)務為廣告業(yè)務,通過數(shù)字人可以更好的完成客戶的需求;而謙尋則是一家MCN公司。但隨著應用和場景的拓展,數(shù)字人成為了其新的發(fā)力方向,萬興科技借數(shù)字人進一步開拓了海外直播、營銷業(yè)務,謙尋借由數(shù)字人找尋到了新一輪直播帶貨流量、成交額增長動力。

源于“出身”的不同,不同廠商的商業(yè)模式和目標也完全不同。

大廠的虛擬人多為服務自身核心戰(zhàn)略而生,比如阿里、京東的虛擬人多被應用在電商領(lǐng)域;騰訊將移動互聯(lián)網(wǎng)時代積累下來的RTC(實時通信技術(shù))應用在虛擬人交互中,打造了智影制作平臺;百度希壤更偏向于表演型虛擬人,為不同企業(yè)提供定制化代言人;而網(wǎng)易則將虛擬人應用在游戲、教育等多個自身業(yè)務中。總的來說,互聯(lián)網(wǎng)大廠并沒有急于將虛擬人獨立對外商業(yè)化,而是受自身技術(shù)的積累和場景需求催生。

核心對外提供服務的主要是原生的數(shù)字人廠商和換道廠商,從上個風口到如今,這類廠商已經(jīng)積累了數(shù)字人的技術(shù)經(jīng)驗,對于底層技術(shù)、細節(jié)把控和場景的探索都有著更為體系化的認知。根據(jù)技術(shù)路線的不同,原生廠商又被分為2D廠商和3D廠商,2D廠商更傾向于虛擬人與場景的結(jié)合,而3D廠商則處于技術(shù)迭代的狀態(tài)。

“2D虛擬人制作有兩種方式,一種是請真人錄制,然后幫其定制形象。一種是從用戶提供的視頻中提取形象,再用到各種場景中。但是2D數(shù)字人沒辦法做到3D那樣轉(zhuǎn)身、跳舞、做各種動作。”即構(gòu)科技對二者的制作差異進行了詳細解釋。

但由于2D虛擬人的制作成本低,帶動了整個虛擬人市場“飛入尋常百姓家”,填補了市場由于價格攔路而不能落地的需求鴻溝。「自象限」了解到,目前原廠廠商是大公司和品牌側(cè)傾向的選擇,通過行業(yè)KA客戶打造標桿案例,比如銀行、大型消費品品牌(健力寶)、美妝品牌(HR赫蓮娜)等等。

換道廠商和跨界廠商有異曲同工之筆,如商湯、美圖等換道廠商,在上個階段積累了CV、圖像識別等技術(shù),被應用在了虛擬人的制作中,而像藍標、謙尋等公司,源于自身的需求出發(fā),為了避免高昂的采購成本,也選擇自研虛擬人,技術(shù)不夠硬核但有固定的客戶群,商業(yè)化冷啟動相對迅速。

產(chǎn)品成熟,重在交付

今年8月、9月開始,虛擬人廠商產(chǎn)品開始加速迭代。據(jù)不完全統(tǒng)計,兩個月內(nèi)至少有10家廠商發(fā)布了新的虛擬人產(chǎn)品。

產(chǎn)品的高度迭代意味著虛擬人正在飛快得適應市場需求,而這也意味著虛擬人第一階段的賽點已經(jīng)走入關(guān)鍵階段。

從類型來看,虛擬人廠商分為兩類,一類直接交付虛擬人產(chǎn)品,包括通用虛擬人產(chǎn)品、行業(yè)垂直場景的虛擬人產(chǎn)品,比如電商、零售、營銷、直播等,客戶即拿即用,或標準化或定制化;另一類則提供虛擬人制作平臺,客戶通過使用平臺提供的工具,自主生產(chǎn)虛擬人。

相比之下,產(chǎn)品交付類型更適合企業(yè)探索虛擬人初期,幾乎不需要技術(shù)團隊配合,門檻更低,也是目前較多企業(yè)選擇的方式。

針對這類產(chǎn)品形式,虛擬人廠商也提供了多樣的購買方案。如汽車試駕一樣,品牌在購買虛擬人之前,可以先可進行Demo的試用,真實感受虛擬人的表情、動作、交互等等。除此之外,品牌在購買前還可以進行方案咨詢,廠商會根據(jù)客戶情況,制定具體的虛擬人傳播方案,并有多種不同風格的虛擬人可以選擇。

以即構(gòu)虛擬人Avatar為例,企業(yè)可選擇擬人形象和Q版形象,并可以在線直接體驗給虛擬人換裝、捏臉,并通過AI完成了表情驅(qū)動、聲音驅(qū)動、文本驅(qū)動、肢體驅(qū)動等全方位的驅(qū)動方式。

▲圖源:即構(gòu)官網(wǎng)截圖

提供制作平臺的廠商產(chǎn)品則更加復雜,如魔琺科技的三款產(chǎn)品分別針對了不同場景進行,包括虛擬視頻、虛擬人直播和獨立的虛擬人服務,并且在后端打造了端到端的寫實3D虛擬人工業(yè)化產(chǎn)線,包括從技術(shù)到調(diào)試到運營的“星云平臺”,讓虛擬人能夠和大模型結(jié)合,長出“腦子”,真正實現(xiàn)3D交互。

▲圖源:魔琺科技發(fā)布會

今年8月,魔琺科技升級了有言AIGC生成平臺、有光直播帶貨平臺和有靈虛擬人制作平臺,為企業(yè)提供系列生成工具,企業(yè)根據(jù)自身需求,能夠更加靈活的調(diào)整虛擬人的細節(jié)、結(jié)構(gòu)和適配的使用場景。

相比之下,商湯既能夠直接交付虛擬人產(chǎn)品,也打造了如影虛擬人制作平臺,基于在視覺、語音領(lǐng)域積累的3萬個算法模型,打造了集智能化生成、智能化驅(qū)動、智能化交互的數(shù)字人平臺。在商湯智能化引擎驅(qū)動下,虛擬人能快速識別、反應,與用戶建立起對話關(guān)系。并且,事后,虛擬人也不會“失憶”,繼續(xù)學習迭代。

這也說明了,當下廠商不僅是商業(yè)模式上的競爭,更是技術(shù)先進性的比拼。

技術(shù)”三級跳“

從整個虛擬人的技術(shù)發(fā)展進程來說,大模型帶來最核心的改變,是推動著虛擬人從第一階段看起來“像人”,到能夠與人實時互動。

▲圖為自象限原創(chuàng),轉(zhuǎn)載請注明出處

第一階段,虛擬人廠商比拼的是“誰看起來更像人”?虛擬人廠商的核心技術(shù)多在傳統(tǒng)的CG(建模)技術(shù)、驅(qū)動技術(shù)、渲染引擎等等,所以虛擬代言人為代表的表演型虛擬人成為了核心交付產(chǎn)品。

但由于技術(shù)的不成熟導致了虛擬人制作成本高企,「自象限」從行業(yè)內(nèi)人士了解到,2022年,某大廠提供的訂制虛擬人價格高達10萬,這讓虛擬人根本無法規(guī)?;涞?。

大模型來了之后,一方面讓虛擬人制作成本進行了大幅度降低;另一方面,AI技術(shù)加速了虛擬人的交互功能,讓虛擬人交互起來更像人。

某虛擬人制作廠商曾吐槽:“以前6888元一個,賣一個賠一個”,通過智能渲染、智能驅(qū)動,流程自動化制作等能力,讓虛擬人的制作成本有了30%-50%的縮減,市面上甚至冒出了“99元、299元一個的虛擬人”。

更重要的是,大模型技術(shù)加速了虛擬人對語言語義的理解能力,讓虛擬人能夠從簡單的檢索生成,到語言文字AI驅(qū)動,更快速的對人的需求進行回復,甚至做到“秒回”,同時模型也驅(qū)動了渲染技術(shù)、擬真技術(shù)、超寫實技術(shù)的進化。

舉個具體的例子:交互的核心并不只是動作反饋,更是內(nèi)容的生成和語音的交流,故而,AIGC技術(shù)和語音生成技術(shù)成為了當下技術(shù)發(fā)展的核心。

▲圖源:網(wǎng)絡

大模型讓虛擬人“長了腦子”,有了思考和推理能力,AIGC技術(shù)讓虛擬人能夠有“想法”,TTS(Text To Speech 文本轉(zhuǎn)語音技術(shù))技術(shù)則讓虛擬人能夠“表達”。

幾天前,在GPT-4V版本更新,TTS實現(xiàn)了進步,文本驅(qū)動語音有了語氣和口吻,在停頓、重音和自然交互程度上有了極大的提升。不僅可以模仿不同的口吻,甚至設定“渣女”時還學會了“夾子音”。

有行業(yè)專家推測:TTS技術(shù)端到端成熟后,對行業(yè)格局的改變會很大。因為虛擬人真的能夠?qū)崟r交互后,落到產(chǎn)業(yè)里才能產(chǎn)生實際價值。

從看起來像人,到實時互動,大模型推動著虛擬人完成二級階躍,但這也只是一個新的開始。從元宇宙到大模型時代,虛擬人真正備受關(guān)注的內(nèi)在原因在于,他將有可能是下一個虛擬時代的“入口”,背后連接著新的虛擬世界,入口屬性讓其變的既性感又危險。

國外最早布局虛擬人的微軟小冰CEO李笛則認為:虛擬人未來是混合模型。

本質(zhì)上,這兩種觀點的內(nèi)核是一致的,只不過李笛的假設更為具體。下一階段,將進入“虛擬人+”的階段,虛擬人+RPA在企業(yè)內(nèi)部打造數(shù)字員工;虛擬人+AI Agent,在C端打造陪伴型機器人;虛擬人+AR/VR,在3D空間打造可見的游戲NPC;虛擬人+具身智能,讓人型機器人有了靈魂。

若將多種技術(shù)進行全面融合,虛擬人才真的能夠成為“入口級應用”。屆時,比拼的賽點將是虛擬人的開放程度、生態(tài)建設、場景拓展等一系列綜合能力。

當虛擬人被賦予了更多能力,其背后的木偶引線到底還能否掌握在人的手里?

這個答案,也著實讓人期待。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章

熱門排行

信息推薦