當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

未來智能CTO王松:會議中的AI Agent,從小任務(wù)到全場景的技術(shù)突破

 2024-08-21 10:56  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

近期,前谷歌CEO施密特在斯坦福大學(xué)的一場閉門演講引發(fā)了廣泛爭議。無論其觀點的正確與否,他的觀點確揭示了一個事實:人工智能競賽似乎是一場只有中美兩國能參與的“游戲”。然而,兩國在人工智能發(fā)展路線上的差異又十分顯著。美國側(cè)重于平臺的研究與開發(fā),而我國則更注重場景的應(yīng)用與商業(yè)閉環(huán)的構(gòu)建。我國的人工智能發(fā)展更加強調(diào)實用性,而非單純的能力展示。8月18日-8月19日,在上海舉辦的AICon 2024全球人工智能開發(fā)與應(yīng)用大會進一步印證了這一差異。該大會以"智能未來,探索AI無限可能"為主題,探討了 AI 商業(yè)洞察和 AI 原生產(chǎn)品的探索路徑,以及大模型和多模態(tài)技術(shù)的實踐和成功應(yīng)用案例。其中的解決方案專場,則以“大模型在多場景下的部署與應(yīng)用”為專題,邀請國內(nèi)人工智能明星企業(yè)分享了當下的技術(shù)實踐。其中人工智能硬件公司未來智能CTO王松受邀參加了解決方案專場,向業(yè)界全面展示了AI Agent在個人會議領(lǐng)域的探索和應(yīng)用。

(未來智能CTO 王松)

創(chuàng)新與實用結(jié)合:未來智能會議Agent引領(lǐng)AI應(yīng)用趨勢

未來智能是辦公會議耳機賽道的領(lǐng)軍企業(yè),自創(chuàng)立之來就以AI為基礎(chǔ),聚焦辦公會議場景,致力于用AI解決用戶辦公會議痛點,成功打造了一系列將AI做到實用的人工智能硬件產(chǎn)品。在AI Agent領(lǐng)域,未來智能依托強大的數(shù)據(jù)基礎(chǔ),早在行業(yè)初期就開始布局相關(guān)技術(shù)研發(fā)和探索。

在大會上,王松詳細介紹了未來智能會議Agent如何通過“感知”、“推理”、“記憶”、“執(zhí)行”四大模塊,精準識別用戶場景,并在不同場景下解決用戶痛點,提升用戶效率。

未來智能會議Agent的技術(shù)探索始終以辦公會議場景為核心,致力于解決用戶在辦公會議中的痛點。對于職場辦公人群來說,大量的時間被各式各樣的會議占據(jù),而這些會議中有的充斥著無效信息,有的則需要會前準備大量資料,會后還需進行會議紀要總結(jié)。如何提高會議效率,正是職場人士面臨的一大難題。

作為一個為用戶打造全鏈路的會議智能體,未來智能會議Agent的每個模塊都有著明確的職責(zé)和具體的功能設(shè)計。在感知模塊中,未來智能會議Agent能夠自動收集會議通知并創(chuàng)建會議日程,從會議開始就幫助用戶提高效率。由于會議信息主要來源于線上和線下兩大信息源,因此會議Agent在獲得系統(tǒng)或硬件的授權(quán)后,可通過技術(shù)手段獲取相關(guān)信息,自動完成任務(wù)創(chuàng)建在推理模塊,當下的LLM大模型依舊存在著能力不足等問題,未來智能則通過自研垂直模型,依托人類處理不同問題時的經(jīng)驗、知識,自適應(yīng)選擇合適的解題思路。通過工程化的方式,未來智能不斷提升會議Agent“大腦”的能力,并為未來更高級的LLM鋪路,不斷積累訓(xùn)練數(shù)據(jù)。

在記憶模塊,未來智能會議Agent則是在場景之下強化數(shù)據(jù)的嵌入,向模擬人腦的記憶工作進化,讓Agent具備長期和短期記憶,能夠?qū)崿F(xiàn)高準確度和命中率,還能快速的訪問和存取。而在執(zhí)行模塊,未來智能會議Agent則是通過LLM來實現(xiàn)任務(wù)的落地和最終執(zhí)行。

未來智能會議Agent的技術(shù)進步迅速。在大會上,王松就會議Agent的技術(shù)水平與新能源汽車智能駕駛相類比,預(yù)計未來智能會議Agent將在明年基本實現(xiàn)L2.5-L3水平,用戶能夠通過端到端的解決方案,讓AI自動完成用戶在會議中的相關(guān)任務(wù),就像當下新能源汽車的高階智駕一樣,用戶僅需手扶方向盤即可。

從小場景小任務(wù)做起,讓AI在使用中不斷進化

未來智能會議Agent的技術(shù)探索并沒有停留在理論層面,而是從更小的場景和更小的任務(wù)出發(fā),通過一個個功能點的創(chuàng)新,讓用戶先受益起來。

例如,面對冗長繁瑣的會議內(nèi)容,訊飛會議耳機內(nèi)置的viaim AI,能夠智能分析記錄內(nèi)容,自動提取記錄中的重點,2小時會議可一鍵生成「摘要總結(jié)」,大幅簡化會后總結(jié)難度,讓會議核心內(nèi)容一目了然。viaim AI還能提取記錄中的關(guān)鍵任務(wù),一鍵生成「待辦事項」,幫助用戶輕松跟蹤會后內(nèi)容。viaim AI還擁有「快速問答」功能,用戶只需語音/文字輸入問題,viaim AI就能回答用戶關(guān)于當前記錄內(nèi)提到的問題和擴展問題,讓用戶快速獲取記錄內(nèi)容中需要的信息。隨著未來智能AI技術(shù)的不斷進化,viaim AI也會常用常新,不斷為用戶帶來更多優(yōu)秀的體驗。

除此之外,未來智能不僅在通用場景中取得了進展,還深入細分行業(yè)領(lǐng)域,展開了廣泛的探索。例如,在金融領(lǐng)域,未來智能正在探索如何讓訊飛會議耳機自動識別金融相關(guān)的會議內(nèi)容,耳機會在會后調(diào)用常用的開源或商業(yè)化的金融領(lǐng)域大模型,自動生成專業(yè)的會議報告。這些報告能夠涵蓋投研、ESG、財經(jīng)、財報等多個投研相關(guān)細分領(lǐng)域,提供一系列專業(yè)的AI支持能力。

這種針對具體行業(yè)的會議技術(shù)解決方案,展示了未來智能技術(shù)的深度和實踐能力。均給參會的行業(yè)人士帶來了深刻的印象。

未來智能在AI Agent領(lǐng)域的探索,不僅展示了中國企業(yè)在技術(shù)路線上的獨特優(yōu)勢,還體現(xiàn)了中國企業(yè)對實用性和場景適用性上的深刻理解。這種在技術(shù)發(fā)展與商業(yè)閉環(huán)之間的平衡,或許正是推動人工智能行業(yè)健康發(fā)展的關(guān)鍵所在??梢哉f,中國的人工智能企業(yè)正在以自己的方式引領(lǐng)全球人工智能發(fā)展的新趨勢。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章

熱門排行

信息推薦