當(dāng)前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

押注數(shù)字人,百度、科大訊飛“短兵相接”

 2023-07-05 15:29  來源: A5專欄   我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過

配圖來自Canva可畫

近兩年,小雀斑、柳夜熙、AYAYI等大量網(wǎng)紅數(shù)字人的相繼出現(xiàn),以及虛擬數(shù)字技術(shù)在《指環(huán)王》和《阿凡達(dá)》以及《刺殺小說家》等電影中的廣泛應(yīng)用,還有北京冬奧會(huì)期間數(shù)字人在手語解說、節(jié)目直播等眾多場(chǎng)合亮相,使得公眾對(duì)數(shù)字人的認(rèn)知上升到了一個(gè)新的臺(tái)階。

 

作為數(shù)字經(jīng)濟(jì)的重要環(huán)節(jié),數(shù)字人為數(shù)字經(jīng)濟(jì)的發(fā)展注入了新的動(dòng)能。于是,各個(gè)行業(yè)企業(yè)便涌現(xiàn)出了多個(gè)玩家,紛紛基于已有的相關(guān)技術(shù)和業(yè)務(wù)基礎(chǔ),開始進(jìn)軍數(shù)字人賽道,數(shù)字人行業(yè)也由此迎來了一波新的發(fā)展熱潮。

 

數(shù)字人乘風(fēng)而起

 

隨著數(shù)字人在各行各業(yè)中的應(yīng)用越來越廣泛,國(guó)內(nèi)數(shù)字人市場(chǎng)規(guī)模也在持續(xù)穩(wěn)步增長(zhǎng)。根據(jù)IDC在《中國(guó)AI數(shù)字人市場(chǎng)現(xiàn)狀與機(jī)會(huì)分析2022》報(bào)告中預(yù)計(jì),到2023年中國(guó)AI數(shù)字人市場(chǎng)規(guī)模將達(dá)102.4億元。而數(shù)字人市場(chǎng)之所以將呈現(xiàn)高速增長(zhǎng)的態(tài)勢(shì),則與三大利好不無關(guān)系。

 

從政策層面來看,國(guó)家政策的大力支持,預(yù)示著數(shù)字人的前景一片大好。近年來,國(guó)內(nèi)虛擬現(xiàn)實(shí)相關(guān)產(chǎn)業(yè)備受外界關(guān)注,自2016年起,國(guó)家就發(fā)布了多項(xiàng)政策支持我國(guó)虛擬現(xiàn)實(shí)產(chǎn)業(yè)的發(fā)展,并將虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)與云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、區(qū)塊鏈、人工智能一起列為了數(shù)字經(jīng)濟(jì)重點(diǎn)產(chǎn)業(yè)。而虛擬數(shù)字人作為虛擬現(xiàn)實(shí)產(chǎn)業(yè)重要的應(yīng)用之一,自然也有望享受到政策利好所帶來的紅利釋放期。

 

從技術(shù)層面來看,數(shù)字技術(shù)的融合發(fā)展,驅(qū)動(dòng)了數(shù)字人進(jìn)入發(fā)展快車道。其實(shí)數(shù)字人出現(xiàn)的時(shí)間并不算晚,只是受技術(shù)應(yīng)用水平的限制,早期的數(shù)字人制作周期長(zhǎng)且成本高。而近幾年,隨著CG、語音合成、深度學(xué)習(xí)算法、自然語言處理等技術(shù)的進(jìn)步,數(shù)字人各環(huán)節(jié)制作周期大大縮短、制作成本明顯降低,數(shù)字人制作也走向了智能化。堅(jiān)實(shí)的技術(shù)基礎(chǔ),不僅創(chuàng)新了數(shù)字人行業(yè)的發(fā)展應(yīng)用,更是加速了數(shù)字人場(chǎng)景化的應(yīng)用落地。

 

從環(huán)境層面來看,AIGC技術(shù)的逐漸成熟,助力了數(shù)字人行業(yè)規(guī)模的拓展。數(shù)字人雖然最初多應(yīng)用于影視、游戲等行業(yè),但隨后應(yīng)用場(chǎng)景將會(huì)不斷拓展。只不過,越復(fù)雜的環(huán)境對(duì)數(shù)字人的信息處理能力、即時(shí)互動(dòng)能力,以及表達(dá)能力等都有著更高的要求。而在AIGC的賦能下,數(shù)字人內(nèi)容生產(chǎn)流程將有望得到創(chuàng)新,可助力數(shù)字人廣泛與各行業(yè)領(lǐng)域相結(jié)合,為數(shù)字人描繪出了極大的創(chuàng)作及交互想象空間。

 

在政策、技術(shù)、環(huán)境的多輪驅(qū)動(dòng)下,數(shù)字人應(yīng)用場(chǎng)景將持續(xù)得到拓展與深化。而隨著數(shù)字人行業(yè)進(jìn)入高速發(fā)展期,國(guó)內(nèi)也已出現(xiàn)了諸多相當(dāng)有競(jìng)爭(zhēng)力的玩家,這其中,以百度為代表的綜合類互聯(lián)網(wǎng)技術(shù)廠商,以及以科大訊飛代表的專長(zhǎng)類AI廠商的表現(xiàn)最為突出,優(yōu)勢(shì)也最為明顯。

 

百度“雙輪驅(qū)動(dòng)”

 

目前來看,數(shù)字人雖然已經(jīng)應(yīng)用于多個(gè)領(lǐng)域,但當(dāng)前市場(chǎng)上大多的數(shù)字人產(chǎn)品精度依舊較低,而百度不僅上線了具備較強(qiáng)的視覺感知和動(dòng)作控制能力,能夠通過手勢(shì)、語音等方式與用戶進(jìn)行互動(dòng)的虛擬數(shù)字人,還搭建了百度智能云曦靈智能數(shù)字人平臺(tái),提供虛擬形象智能交互解決方案,而這些產(chǎn)品的生成,都源于百度為數(shù)字人相關(guān)開發(fā)提供了絕佳的土壤。

 

一方面,百度在AI技術(shù)上的領(lǐng)先優(yōu)勢(shì),能夠高效率、高質(zhì)量地推動(dòng)其數(shù)字人技術(shù)的迭代升級(jí)。眾所周知,數(shù)字人的發(fā)展離不開計(jì)算機(jī)視覺、智能語音、自然語言處理等AI技術(shù)的支持,而作為國(guó)內(nèi)唯一一家既有視覺能力,又有語音、語義相關(guān)包括計(jì)算機(jī)圖形學(xué)自動(dòng)生成全鏈路AI能力平臺(tái)型的公司,百度已經(jīng)積累了大量全棧AI能力,而這無疑是其數(shù)字人成功落地的實(shí)力與底氣。

 

另一方面,百度標(biāo)準(zhǔn)化、平臺(tái)化的優(yōu)勢(shì),可以有效降低運(yùn)營(yíng)門檻,助其數(shù)字人實(shí)現(xiàn)廣泛應(yīng)用。想要實(shí)現(xiàn)“人均一個(gè)”數(shù)字人,產(chǎn)品標(biāo)準(zhǔn)化、平臺(tái)化必不可少。得益于百度在視覺、NLP、語音交互等底層全棧AI技術(shù)優(yōu)勢(shì)的長(zhǎng)期積累,以及PLATO百億參數(shù)對(duì)話大模型,百度智能云已經(jīng)將這一能力平臺(tái)化、標(biāo)準(zhǔn)化,這不僅使其部署成本更低,周期更短,還可以做到一次部署、一次建設(shè),并在多個(gè)場(chǎng)景下形成虛擬數(shù)字人能力,實(shí)現(xiàn)端到端軟硬一體的商業(yè)應(yīng)用。

 

百度憑借無可比擬的AI能力,加之在標(biāo)準(zhǔn)化、平臺(tái)化中服務(wù)穩(wěn)定、成本低廉等特點(diǎn),在數(shù)字人領(lǐng)域先發(fā)制人,在產(chǎn)品力、市場(chǎng)上走在了行業(yè)前列。據(jù)了解,百度智能數(shù)字人平臺(tái)是世界上首個(gè)在線語音交互注意力模型,實(shí)現(xiàn)與數(shù)字人自然暢通交流,高準(zhǔn)確度的音畫同步,逐字口型準(zhǔn)確率>98.5%。另外,目前百度終端虛擬人產(chǎn)品,也已經(jīng)以智能客服的形象,成功落地在了深圳、重慶、鄭州等多個(gè)城市的各大地鐵站,全天候?yàn)閬硗某丝吞峁┳畋憷闹悄茏稍兎?wù)。

 

科大訊飛“三線出擊”

 

數(shù)字人已經(jīng)成為多家廠商發(fā)力的重點(diǎn),凡是進(jìn)入的玩家都在機(jī)器視覺、語音交互和自然語言處理等方面有著或多或少的技術(shù)積累,而盡管國(guó)內(nèi)諸多互聯(lián)網(wǎng)大廠和科技巨頭都瞄準(zhǔn)了數(shù)字人賽道,但作為亞太地區(qū)知名的智能語音和人工智能上市企業(yè),科大訊飛同樣在推動(dòng)數(shù)字人產(chǎn)品和場(chǎng)景應(yīng)用落地上,建立起了自己的優(yōu)勢(shì)。

 

一是,科大訊飛所具有的豐富的技能和問答知識(shí)儲(chǔ)備,可以讓其數(shù)字人變得更加聰慧智能。一直以來,科大訊飛都在致力于讓機(jī)器“能聽會(huì)說,能理解會(huì)思考”,其開發(fā)的星火大模型不僅在開放式知識(shí)問答上取得了突破,其多輪對(duì)話、邏輯和數(shù)學(xué)能力也有所升級(jí)。而科大訊飛語言理解、知識(shí)問答、邏輯推理等各項(xiàng)能力的持續(xù)提升,能夠使其數(shù)字人準(zhǔn)確地理解用戶問題,并給出自然、準(zhǔn)確的回答,為用戶帶來更為豐富的使用體驗(yàn)。

 

二是,科大訊飛在智能語音技術(shù)方面的深厚積淀,可以為其數(shù)字人的落地提供全鏈路保障??拼笥嶏w自成立以來,就一直從事著智能語音、自然語言理解、計(jì)算機(jī)視覺等核心技術(shù)的研究,并且其在語音、圖像、自然語言理解、機(jī)器認(rèn)知推理能力、多語種多模態(tài)人機(jī)交互等方面的技術(shù)和產(chǎn)業(yè)化應(yīng)用已具有業(yè)界領(lǐng)先水平。得益于此,科大訊飛的數(shù)字人也就能得到語音識(shí)別、語義理解、語音合成、形象驅(qū)動(dòng)、視頻渲染服務(wù)的全鏈路保障。

 

三是,科大訊飛專屬的數(shù)字人定制能力,有助其在眾多廠商中形成差異化優(yōu)勢(shì)??拼笥嶏w可以根據(jù)客戶要求,在客戶的不同業(yè)務(wù)場(chǎng)景下進(jìn)行AI虛擬人賦能,為客戶提供一站式、定制化AI虛擬人服務(wù)。比如,在服務(wù)部署上,可以靈活采用公有云或私有云的部署方案,保障交互服務(wù)的安全穩(wěn)定;在形象聲音上,可以根據(jù)客戶音色、風(fēng)格的需求靈活定制專屬的個(gè)性化語音庫;在虛擬人形象上,可以支持2D真人形象,從而為客戶定制專有IP形象。

 

仍需負(fù)重前行

 

在數(shù)字時(shí)代,數(shù)字人已經(jīng)開始在各個(gè)企業(yè)中扮演關(guān)鍵角色。然而對(duì)于數(shù)字人企業(yè)而言,打通產(chǎn)業(yè)鏈各環(huán)節(jié)、修煉技術(shù)“內(nèi)功”,才是打造競(jìng)爭(zhēng)優(yōu)勢(shì)、強(qiáng)化競(jìng)爭(zhēng)壁壘的關(guān)鍵。因此,即便是國(guó)內(nèi)數(shù)字人發(fā)展較為成熟的公司,已經(jīng)在客戶積累、技術(shù)實(shí)力、銷售渠道、資金供給等方面具備了一定積累,但由于數(shù)字人行業(yè)天花板依舊較高,想要維持長(zhǎng)期和衍生發(fā)展并不容易。

 

一方面,國(guó)內(nèi)數(shù)字人尚處于起步階段,距離商業(yè)化規(guī)模推廣仍有一定距離。盡管國(guó)內(nèi)諸多企業(yè)的數(shù)字人已經(jīng)實(shí)現(xiàn)了場(chǎng)景化應(yīng)用,但就整體而言,我國(guó)數(shù)字人行業(yè)發(fā)展仍處于起步階段,不僅尚未跑出一個(gè)覆蓋全產(chǎn)業(yè)鏈的數(shù)字人企業(yè),大多數(shù)企業(yè)在數(shù)字人情緒感知、語義理解、情感連接等方面仍有所欠缺。另外,國(guó)內(nèi)各家數(shù)字人在細(xì)分市場(chǎng)上的產(chǎn)品也都還仍處于試驗(yàn)可行性的階段,大規(guī)模商業(yè)化暫時(shí)還難以實(shí)現(xiàn)。

 

另一方面,海外巨頭的數(shù)字人優(yōu)勢(shì)明顯,國(guó)內(nèi)企業(yè)想要追趕還需更加努力。國(guó)內(nèi)領(lǐng)先企業(yè)的數(shù)字人產(chǎn)品雖然已經(jīng)頗具特色,但國(guó)內(nèi)企業(yè)更側(cè)重AI技術(shù)的開發(fā)與內(nèi)容應(yīng)用,因此數(shù)字人產(chǎn)品大多探索的是其在社交活動(dòng)、新聞媒體、文旅等領(lǐng)域的應(yīng)用。而海外巨頭多聚焦于數(shù)字人的基礎(chǔ)建設(shè),技術(shù)優(yōu)勢(shì)較為明顯。比如英偉達(dá)、Unity等均基于自身技術(shù)優(yōu)勢(shì)向下游生產(chǎn)技術(shù)服務(wù)平臺(tái)延伸,相較于國(guó)內(nèi),其技術(shù)壁壘就更為深厚。

 

目前來看,國(guó)內(nèi)以百度、科大訊飛為代表的科技企業(yè)在數(shù)字人上的探索雖然還有一定難度,但值得注意的是,在各個(gè)大廠的不斷發(fā)力,以及人工智能技術(shù)的大力加持下,數(shù)字人的制作運(yùn)營(yíng)效率有望得到持續(xù)優(yōu)化,其應(yīng)用價(jià)值也將得到不斷釋放。而隨著百度、科大訊飛不遺余力地加速數(shù)字人的進(jìn)程,其數(shù)字人的未來也將會(huì)非常值得期待。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
數(shù)字人
科大訊飛
百度

相關(guān)文章

熱門排行

信息推薦