1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

 2024-09-03 11:00  來源:A5專欄  我來投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競價(jià),好“米”不錯(cuò)過

智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent 7.0,看RPA Agent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)I Agent真的實(shí)現(xiàn)了流程全自動(dòng)化AI Agent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPA Agent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)在Agent 7.0 ,這款神器做到了B端與C端通吃C端AI Agent構(gòu)建與應(yīng)用實(shí)現(xiàn)端到端,這個(gè)智能體構(gòu)建平臺(tái)真的不一般

文/王吉偉

智能體的爆發(fā),意味著大語言模型的快速落地與應(yīng)用。所以它一經(jīng)提出便如泄洪之水一發(fā)而不可收,直至現(xiàn)在如火如荼。

尤其是在智能體工作流(Agentic Workflow)的加持下,智能體表現(xiàn)出了更強(qiáng)的易用性和適應(yīng)性。除了解決簡單工作流的自動(dòng)化,也在積極融合進(jìn)入更多的傳統(tǒng)業(yè)務(wù)流程和應(yīng)用場景。

王吉偉頻道在《Agentic Workflow新范式,基于大語言模型的工作流、業(yè)務(wù)流程、智能體大融合》一文中提到過,廣義上的Agentic Workflow是包含傳統(tǒng)軟件(工具、解決方案)、大語言模型、AI Agent等在內(nèi)的新型業(yè)務(wù)流程的集合,其中用RPA等超自動(dòng)化工具將輕量化LLM工作流與傳統(tǒng)工作流相連接的工作流,將會(huì)成為企業(yè)業(yè)務(wù)流程的重要形式。

當(dāng)前的AI Agent構(gòu)建平臺(tái)所構(gòu)建的AI Agent通過各種插件和工作流已經(jīng)可以做到較長的流程,但仍然無法操作沒有API接口和沒有開放API的大型以及遺留的企業(yè)級(jí)應(yīng)用程序,并且API接口也不能保障絕對的穩(wěn)定。

因此在智能體的應(yīng)用上,用RPA來連接多種應(yīng)用系統(tǒng)以保障數(shù)據(jù)的流通是不可或缺的,這對于已將RPA應(yīng)用于企業(yè)運(yùn)營人機(jī)交互層的組織來說則更加重要。

在企業(yè)級(jí)智能體的解決方案上,基于RPA構(gòu)建的或者以RPA為tools的RPA Agent越發(fā)受到廣大組織重視,原因正是它能夠彌補(bǔ)單純的API類智能體的不足,可以通過“API+UI”雙重自動(dòng)化極大提升智能體的應(yīng)用潛力。RPA已經(jīng)成為智能體的重要技術(shù),也是實(shí)現(xiàn)基于LLM的智能自動(dòng)化的必要技術(shù)之一。

從去年LLM爆發(fā)以來,RPA\超自動(dòng)化廠商們也都在持續(xù)進(jìn)化,完成了RPA Agent的產(chǎn)品化進(jìn)階。那么它們進(jìn)化到什么程度了?在王吉偉頻道寫這個(gè)選題期間,恰好實(shí)在智能發(fā)布了最新產(chǎn)品實(shí)在Agent 7.0。這篇文章,我們就以這款產(chǎn)品為例,透視國產(chǎn)RPA Agent產(chǎn)品的發(fā)展情況。

先來看兩個(gè)例子

在詳細(xì)介紹實(shí)在Agent之前,先來看幾個(gè)實(shí)際操作案例。

案例1:采集豆瓣新片排行榜發(fā)送給同事

這是一個(gè)娛樂類的案例。如果你想為同事推薦最新的十部電影,過去需要打開豆瓣電影的新品排行榜,逐個(gè)復(fù)制電影名稱,通過微信或者釘釘發(fā)送給朋友?,F(xiàn)在使用實(shí)在Agent,只需要打開軟件,輸入 「采集豆瓣電影片排行榜前十(電影名、評分)」,它就能自動(dòng)分析你的需求并拆解成執(zhí)行步驟,然后點(diǎn)一下 執(zhí)行 ,它就會(huì)自動(dòng)采集相關(guān)數(shù)據(jù)并把數(shù)據(jù)填入到釘釘,發(fā)送給你的同事。

案例2:在騰訊文檔制做年終匯報(bào)幻燈片

這是一個(gè)辦公應(yīng)用的案例。按照正常步驟操作這個(gè)業(yè)務(wù)流程,需要打開騰訊文檔,搜索相關(guān)文檔,再制作成PPT。使用實(shí)在Agent智能體,只需要告訴它 「明天要去匯報(bào),去騰訊文檔里做一個(gè)叫年中匯報(bào)的幻燈片 」,它就會(huì)把你的需求拆解成相應(yīng)的執(zhí)行步驟,然后點(diǎn)擊 執(zhí)行 按鈕,幾分鐘后就能在騰訊文檔走出一個(gè)幻燈片。

除了這兩個(gè)案例,實(shí)在智能還給王吉偉頻道展示了獲取百度貼吧前10個(gè)熱門貼吧相關(guān)信息、京東關(guān)注商品降價(jià)通知發(fā)送、京東購物車商品結(jié)算等案例。

王吉偉頻道還實(shí)際測試了12306查詢車次、給微信好友添加標(biāo)簽及發(fā)送信息等應(yīng)用案例,都能一一完成。實(shí)在Agent智能體預(yù)制了很多代表性案例,感興趣的朋友可以親自嘗試。

據(jù)悉,目前實(shí)在Agent已經(jīng)能夠?qū)︶斸?、微信、企業(yè)微信等集成辦公軟件進(jìn)行精確操作,并能通過屏幕識(shí)別技術(shù)對淘寶、京東、攜程及12306等網(wǎng)站進(jìn)行精確識(shí)別。

實(shí)在智能正在對更多的軟件系統(tǒng)進(jìn)行適配,以后大家需要操作的工作、生活及學(xué)習(xí)等業(yè)務(wù)流程,都能通過使用自然語言與實(shí)在Agent智能體交流實(shí)現(xiàn)相應(yīng)業(yè)務(wù)流程的自動(dòng)化,且這些Agent流程都是可以復(fù)用的,一次創(chuàng)建多次使用。

實(shí)在Agent 7.0.0有什么特點(diǎn)?

以上兩個(gè)實(shí)操案例,來自于實(shí)在Agent 7.0。新版Agent 7.0具備以下幾個(gè)特點(diǎn):

自然對話交互:“All in One”式助理工作體驗(yàn);意圖理解、流程規(guī)劃:更為強(qiáng)大的意圖理解+流程精準(zhǔn)拆解規(guī)劃能力;多代產(chǎn)品能力集成:實(shí)現(xiàn)一代RPA、二代IPA數(shù)字員工元素拾取、組件、流程編排等全部能力集成;軟件界面精準(zhǔn)操作:Agent多模態(tài)屏幕語義理解,屏幕掃描識(shí)別,界面精準(zhǔn)操作;

實(shí)在智能千億參數(shù)訓(xùn)練的底層TRAS大模型也再次進(jìn)化,訓(xùn)練參數(shù)量更大,支持自然語言溝通工作、科普知識(shí),高效執(zhí)行任務(wù)完成工作,對話工作兩不誤。

在智能問答方面,基于實(shí)在智能文檔系統(tǒng)(IDP),能夠給實(shí)現(xiàn)文件的精確問答及處理。

此外,該公司已經(jīng)繼續(xù)深入探索企業(yè)大模型、數(shù)字員工運(yùn)營管理平臺(tái)、RAG和Agentic Workflow等技術(shù)和產(chǎn)品整合研究,實(shí)在智能創(chuàng)始人孫林君曾在2024年世界人工智能大會(huì)上提到“企業(yè)大腦”解決方案。

目前它們正在逐步推出企業(yè)知識(shí)庫定制訓(xùn)練服務(wù),通過RAG讓Agent能夠回答企業(yè)內(nèi)部專屬的知識(shí)內(nèi)容和流程內(nèi)容,讓知識(shí)和流程資產(chǎn)創(chuàng)新價(jià)值。

之所以能做到這些,在于其對于技術(shù)和產(chǎn)品研發(fā)的執(zhí)著,并且產(chǎn)研投入量極大。此次版本大更新花費(fèi)近一年時(shí)間,深入更新迭代了底層較多技術(shù)架構(gòu)、功能架構(gòu)、RPA組件等。

實(shí)在智能在RPA有6年技術(shù)沉淀,在AI有6年能力、人才等的積累,多年的技術(shù)沉淀、對市場需求的準(zhǔn)確把握以及對技術(shù)走向的前瞻性預(yù)判,使得他們能夠在LLM與AI Agent爆發(fā)之后先一步扛起RPA Agent的行業(yè)大旗。

作為國內(nèi)首家發(fā)布明確意義上的AI Agent智能體的公司,實(shí)在智能的系列產(chǎn)品已經(jīng)先一步實(shí)現(xiàn)依據(jù)個(gè)人訴求生成工作流程、識(shí)別工作環(huán)境(瀏覽器、網(wǎng)頁、通訊軟件、工作軟件等)、自主執(zhí)行任務(wù)及流程,在保證智能體能夠在B端為廣大組織提供企業(yè)級(jí)服務(wù)的同時(shí),也用標(biāo)準(zhǔn)化、易用化的產(chǎn)品進(jìn)入C端市場服務(wù)更多個(gè)人用戶。

與Coze等Agent平臺(tái)有什么區(qū)別?

看了上面兩個(gè)案例,是不是感覺使用實(shí)在Agent超級(jí)簡單?

沒錯(cuò),使用實(shí)在Agent智能體的全部流程僅是 「輸入需求-點(diǎn)擊執(zhí)行-收到結(jié)果」 這么簡單,完全不用考慮其他操作,實(shí)現(xiàn)了軟件使用上的端到端。理論上,隨著軟件的不斷迭代,這種端到端的方式可以做到任何業(yè)務(wù)流程的自動(dòng)化創(chuàng)建和自動(dòng)化執(zhí)行。

提及智能體,目前大家更熟悉的可能是Coze、Dify、GPTs等平臺(tái)上用戶所創(chuàng)建的各種智能體。從上面的案例大家應(yīng)該能夠體會(huì)到,實(shí)在Agent與它們最大的區(qū)別是在智能體構(gòu)建上幾乎不需要人為參與(流程中斷時(shí)需要人為干預(yù)),都由實(shí)在Agent自行完成。

其他平臺(tái)的Agent構(gòu)建方式是:人力構(gòu)建智能體,智能體自動(dòng)化執(zhí)行任務(wù)。實(shí)在Agent的構(gòu)建方式則是:自動(dòng)化構(gòu)建智能體,智能體自動(dòng)化執(zhí)行任務(wù)。這種方式,實(shí)現(xiàn)了從構(gòu)建到執(zhí)行的全自動(dòng)化。

所以,在使用實(shí)在Agent智能體時(shí),用戶不用再像在Coze等平臺(tái)一樣通過輸入提示詞、選擇插件、搭建工作流等操作去構(gòu)建一個(gè)智能體,極大地節(jié)省了用戶構(gòu)建應(yīng)用的時(shí)間(自動(dòng)化構(gòu)建可以讓用戶忙其他事情),并進(jìn)一步降低了智能體的構(gòu)建門檻,真正實(shí)現(xiàn)了一句話構(gòu)建智能體,所想即所得。

此外,想要在智能體平臺(tái)構(gòu)建能夠深度操作釘釘、微信等智能體,沒有相應(yīng)的API接口是無法實(shí)現(xiàn)的,且平臺(tái)生態(tài)之間的API還存在著一定的連接安全性、限制性等問題,通過RPA模仿人類操作的形式則完成杜絕了此類問題的發(fā)生。

端到端這個(gè)術(shù)語經(jīng)常應(yīng)用于B端企業(yè)級(jí)技術(shù)解決方案,主要強(qiáng)調(diào)技術(shù)、方案、流程及系統(tǒng)的完整性,也更強(qiáng)調(diào)產(chǎn)品應(yīng)用的易用性和廣泛性。

實(shí)在智能的端到端,一方面可以理解為從B端到C端。因?yàn)閷?shí)在智能要做的,不僅是能在B端為企業(yè)提供專業(yè)級(jí)的Agent數(shù)字員工解決方案,更要在C端為個(gè)人用戶帶來解決長尾低頻自動(dòng)化需求的智能助理。從全新的實(shí)在Agent 7.0來看,他們做到了。

另一方面,還可以理解為C端的技術(shù)實(shí)現(xiàn)。實(shí)在Agent把“端到端”的技術(shù)特點(diǎn)和便捷特性賦予了智能體的C端構(gòu)建與應(yīng)用,把“RPA人人可用”的愿景進(jìn)一步拓展為”Agent人人可用”。在LLM的加持下,這個(gè)愿景將會(huì)快速變?yōu)楝F(xiàn)實(shí)。

2023年8月,隨著實(shí)在Agent智能體的面世,實(shí)在智能成為國內(nèi)首家發(fā)布AI Agent智能體的AI科技公司。2024年8月,實(shí)在Agent 7.0發(fā)布后,實(shí)在智能再次成為RPA業(yè)界首家推出Agent產(chǎn)品形態(tài)的AI科技企業(yè)。

而這個(gè)進(jìn)程,僅用了1年。

【王吉偉頻道,關(guān)注AIGC與IoT,專注數(shù)字化轉(zhuǎn)型、業(yè)務(wù)流程自動(dòng)化與AI Agent,歡迎關(guān)注與交流。】

全文完

申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 通義靈碼AI編程能力再進(jìn)化,說幾句話就能開發(fā)網(wǎng)頁

    9月19日,在2024杭州云棲大會(huì)上,隨著通義大模型能力的全面提升,阿里云通義靈碼迎來重磅升級(jí),從一年前只能完成基礎(chǔ)的輔助編程任務(wù),進(jìn)化到幾句話就能完成需求理解、任務(wù)拆解、代碼編寫、修改BUG、測試等開發(fā)任務(wù),最快幾分鐘可從0到1完成應(yīng)用開發(fā),提升數(shù)十倍開發(fā)效率。自去年首次亮相以來,通義靈碼已入職中

    標(biāo)簽:
    通義千問
  • 何小鵬駕駛“全球首款A(yù)I汽車”亮相云棲大會(huì) 深化與阿里云AI算力合作

    9月19日,小鵬汽車董事長CEO何小鵬駕駛“全球首款A(yù)I汽車”P7+亮相2024云棲大會(huì),這款車搭載了業(yè)內(nèi)領(lǐng)先的端到端大模型。過去2年,小鵬汽車與阿里云共建的AI算力規(guī)模提升超4倍。何小鵬表示,將繼續(xù)深化與阿里云的AI算力合作,加速推動(dòng)端到端大模型拓展自動(dòng)駕駛上限,提升下限。端到端是當(dāng)下最受業(yè)界關(guān)注

  • 阿里CEO吳泳銘:機(jī)器人將是下一個(gè)迎來巨變的行業(yè)

    9月19日,阿里巴巴集團(tuán)CEO、阿里云智能集團(tuán)董事長兼CEO吳泳銘在2024云棲大會(huì)上發(fā)表主題演講。他認(rèn)為,過去22個(gè)月,AI發(fā)展的速度超過任何歷史時(shí)期,但我們依然還處于AGI變革的早期。生成式AI最大的想象力,絕不是在手機(jī)屏幕上做一兩個(gè)新的超級(jí)app,而是接管數(shù)字世界,改變物理世界。阿里巴巴集團(tuán)C

  • “創(chuàng)造市場”與“算法進(jìn)化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場,而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場,BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個(gè)數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會(huì)IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級(jí)輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供

  • 機(jī)器人大會(huì)引領(lǐng)產(chǎn)業(yè)動(dòng)向,卓翼飛思繪制無人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬眾矚目的2024世界機(jī)器人大會(huì)暨博覽會(huì)在北京亦創(chuàng)國際會(huì)展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會(huì),反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場逛展觀眾高達(dá)25萬人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會(huì)火爆程度便可知

熱門排行

編輯推薦