11月1日-11月2日,AIIA2019人工智能開發(fā)者大會在杭州未來科技城學(xué)術(shù)交流中心震撼啟幕。本次大會由中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟,杭州市人民政府主辦,信通院、杭州市科學(xué)技術(shù)局等單位聯(lián)合承辦。千人齊聚暢議發(fā)展之道,百位大咖蒞臨激情演講,十場論壇覆蓋前沿?zé)狳c(diǎn),兩大公開課干貨滿滿。
作為NLP技術(shù)的領(lǐng)導(dǎo)者,竹間智能于11月1日主辦了本次大會的“創(chuàng)智—NLP·知情感·創(chuàng)未來”主題論壇,論壇邀請竹間智能創(chuàng)始人兼CEO簡仁賢、竹間智能市場負(fù)責(zé)人王桉、Breeno語音負(fù)責(zé)人龐佳寧、交通大學(xué)教授趙海、南京新一代人工智能研究院副總經(jīng)理董曉飛、竹間智能產(chǎn)品咨詢高級顧問多位業(yè)界領(lǐng)袖,企業(yè)及學(xué)術(shù)界專家,與現(xiàn)場來賓探討NLP的前沿技術(shù)及產(chǎn)業(yè)發(fā)展落地,呈現(xiàn)一場精彩的NLP盛宴。
竹間智能創(chuàng)始人兼CEO簡仁賢以《情感智能,NLP的未來與開放》為主題,揭開當(dāng)天NLP論壇第一講。
談及NLP的未來發(fā)展,簡仁賢認(rèn)為“NLP將顛覆整個搜索引擎”,人類交互依靠自然語言,語音,表情,和肢體動作,是一種多模態(tài)的表達(dá)方式,單純的搜索引擎終將被代替。但是聲音、語言內(nèi)容尤其是文字部分很難推敲,如何將NLP應(yīng)用到生活領(lǐng)域就成了目前值得不斷研究和實(shí)踐的問題。
作為一個創(chuàng)業(yè)家,簡仁賢看中技術(shù),也看重用戶需求,他認(rèn)為一個產(chǎn)品,如果沒有切入到用戶的真正需要,那么產(chǎn)生的基本上是“偽需求”。秉著這樣的信念,在竹間創(chuàng)立之初,希望在語音產(chǎn)品上融入【情感】,真正產(chǎn)生用戶粘性,像電影《HER》一樣觸達(dá)人類心靈。
同時簡仁賢也在思考如何做更通用的語音助手產(chǎn)品。“我相信未來每一個人都可以用很簡單的方式去完成他想做的事情,或者好玩的事情,或者有用的事情”,他笑說隨著手機(jī)發(fā)展衍生出很多疾病,手指疾病到現(xiàn)在的脊椎疾病,未來應(yīng)該簡化到一個指令就可以完成任務(wù),“不需要做低頭族”。
針對如何驗(yàn)證場景能不能行得通,簡仁賢還總結(jié)出一套方法論,即價值創(chuàng)造三模式三形態(tài)。三模式即:優(yōu)化用戶體驗(yàn)、提高生產(chǎn)效率、和降低成本;三種AI應(yīng)用形態(tài):AI全自動處理,AI作為輔助,人機(jī)協(xié)作。
簡仁賢認(rèn)為未來NLP將不限于語音助理、企業(yè)客服、咨詢機(jī)器人:NLP可以解決的問題更多、更大,凡是文檔、非結(jié)構(gòu)化數(shù)據(jù),都可以用NLP來處理。NLP可以用來讀文檔,處理文檔,從文檔里面抽取知識,建立知識。
對NLP賽道所抱有的信心并不是盲目樂觀,引用Gartner 2019年7月的炒作周期報告,兩年前NLP和語音處理到達(dá)期望值頂端,目前正在下降走出泡沫期,經(jīng)過死亡谷,所以當(dāng)前正處在蓄勢爆發(fā)的前夕。
簡仁賢跟現(xiàn)場開發(fā)者分享自己的開發(fā)心得,做NLP要找到對的應(yīng)用才會有價值。
“我常常說不要只做科研,只做科研可能沒辦法讓你學(xué)到很多東西,先找問題、需求。找到問題,找需求,你的科研方向就會對,當(dāng)你的問題需求變成一個產(chǎn)品,產(chǎn)品則會變得非常有價值。”
談及去年Google發(fā)布的BERT模型,針對其Masked LM加下一個句子的預(yù)測,再進(jìn)行Fine—tuning的過程,簡仁賢指出,一個火熱的模型其實(shí)也有不足。一方面,由于BERT需要大量的數(shù)據(jù)和大量的處理,所以訓(xùn)練的速度很慢,它需要的資源也非常多。另一方面,BERT掌握的中文語料數(shù)量和質(zhì)量有限,缺少足夠的中文數(shù)據(jù)做應(yīng)用。
竹間智能在兩年半前開發(fā)出的語意理解技術(shù),與BERT很相似,但比它更快。用三個金融客戶的案例對比發(fā)現(xiàn),竹間模型平均比BERT快2個點(diǎn),訓(xùn)練速度快50倍。因?yàn)锽ERT是通用模型,而竹間模型針對領(lǐng)域進(jìn)行優(yōu)化,減少了所需要的資源。同時竹間模型會在不犧牲準(zhǔn)確率的情況下,在應(yīng)用中達(dá)到比BERT的效率高的效果。
簡仁賢指出,在未來語意理解的范疇里,理想就是做到用更少的算力和語料做出更好的模型。
經(jīng)過四年研發(fā)實(shí)踐積累,目前竹間模型實(shí)現(xiàn)三大優(yōu)勢:一是模型精煉、訓(xùn)練速度快;二是語料豐富,擁有豐富的閑聊語料;三是能進(jìn)行真實(shí)的、流暢的上下文,且支持英文、德語等多語言交互。
簡仁賢跟大家分享了許多實(shí)際案例,從無標(biāo)點(diǎn)長難句、命名實(shí)體識別、語義解析等方面具體探討當(dāng)前技術(shù)難點(diǎn)和運(yùn)用。
面對竹間自身和整個NLP賽道的局限,簡仁賢還跟NLP開發(fā)者們分享,未來NLP的關(guān)鍵技術(shù)會在哪里,呼吁大家共同努力,為NLP技術(shù)的進(jìn)步貢獻(xiàn)力量:
1. 少樣本/零樣本的學(xué)習(xí),把預(yù)訓(xùn)練模型進(jìn)行壓縮,需要的訓(xùn)練數(shù)據(jù)會越來越少;
2. 將知識和常識引入NLP:目前NLP是沒有知識和常識的,比如說“北京很冷”這句話,目前技術(shù)可以識別“北京”是一個地點(diǎn),但是它不懂北京是一個怎么樣的概念;
3. 多模態(tài):結(jié)合聲音、肢體、臉部表情和語言內(nèi)容一起判斷說話的真正意義;
4. 要做可解釋、可控的NLP。如果語音助理不可控,說的話超出當(dāng)前社會人文可接受的范圍,就是對整個社會不負(fù)責(zé)任。
最后簡仁賢表示,竹間希望給企業(yè)帶來無限可能,未來將繼續(xù)通過技術(shù)豐富合作伙伴的業(yè)務(wù)場景,為客戶和終端用戶提供最好的服務(wù)。同時也期待下一代語音助理能夠來臨,越來越成熟。
Breeno 語音負(fù)責(zé)人龐佳寧以《從自然到簡單——NLP賦能新場景》為主題,展開了豐富的分享內(nèi)容。
自然語言處理技術(shù),為手機(jī)交互方式從GUI進(jìn)化到VUI+GUI提供了技術(shù)基礎(chǔ),而自然語言處理技術(shù)的持續(xù)革新發(fā)展,讓用戶與機(jī)器之間的對話越來越自然。從早期部分人群嘗鮮,到現(xiàn)在有更大的用戶群體開始使用語音助手,并且應(yīng)用的語音技能趨于扁平化、長尾化,對時效性、趣味性和細(xì)分領(lǐng)域的要求越來越高。但與手機(jī)的交流不止局限于語音,手機(jī)設(shè)備上協(xié)同包括智能語音、全局搜索、智慧識屏、智能短信等在內(nèi)的資源,可以多場景為用戶提供智能體驗(yàn)。以手機(jī)為核心,依托多種智能終端設(shè)備,語音服務(wù)覆蓋用戶家居、駕駛、運(yùn)動、教育等全生活場景。竹間與OPPO在Breeno語音有開展合作,提供的是一個平臺的載體能力,方便開發(fā)者參與其中,以非常低的開發(fā)成本觸達(dá)到用戶,平臺以極簡開發(fā)模式,提供穩(wěn)健的技術(shù)能力支持,精準(zhǔn)、高效的分發(fā)服務(wù)/內(nèi)容順暢的用戶體驗(yàn)幫助。
竹間智能產(chǎn)品咨詢顧問分享了竹間如何以情感智能為企業(yè)賦能。竹間在政務(wù)大廳的實(shí)體機(jī)器人,正是因機(jī)關(guān)所希望達(dá)到的“最多跑一次”的理念而誕生。來訪市民可以通過機(jī)器人進(jìn)行咨詢,在對話過程中把業(yè)務(wù)辦理完成。竹間的知識圖譜不僅在政務(wù),還應(yīng)用在金融業(yè)、制造業(yè),基于圖譜搭建機(jī)器人平臺從而提供服務(wù),并實(shí)現(xiàn)全天候的業(yè)務(wù)辦理及擬人化的體驗(yàn)。
機(jī)器人不僅需要有對話能力更需要具備對話管理能力。竹間機(jī)器人能夠從多輪對話跳轉(zhuǎn)到知識圖譜,解答場景問題,監(jiān)測客戶情緒、語速和情感、提取客戶畫像,識別到客戶辦理的意圖,并提供流程引導(dǎo),同時也會產(chǎn)生相應(yīng)的報表,在后臺進(jìn)行記錄。
竹間人希望未來每個人都能夠擁有一個能夠聽懂、看懂、讀懂情感,真正成為人類伙伴的對話機(jī)器人。
竹間智能產(chǎn)品咨詢顧問分享了竹間如何以情感智能為企業(yè)賦能。竹間在政務(wù)大廳的實(shí)體機(jī)器人,正是因機(jī)關(guān)所希望達(dá)到的“最多跑一次”的理念而誕生。來訪市民可以通過機(jī)器人進(jìn)行咨詢,在對話過程中把業(yè)務(wù)辦理完成。竹間的知識圖譜不僅在政務(wù),還應(yīng)用在金融業(yè)、制造業(yè),基于圖譜搭建機(jī)器人平臺從而提供服務(wù),并實(shí)現(xiàn)全天候的業(yè)務(wù)辦理及擬人化的體驗(yàn)。
機(jī)器人不僅需要有對話能力更需要具備對話管理能力。竹間機(jī)器人能夠從多輪對話跳轉(zhuǎn)到知識圖譜,解答場景問題,監(jiān)測客戶情緒、語速和情感、提取客戶畫像,識別到客戶辦理的意圖,并提供流程引導(dǎo),同時也會產(chǎn)生相應(yīng)的報表,在后臺進(jìn)行記錄。
竹間人希望未來每個人都能夠擁有一個能夠聽懂、看懂、讀懂情感,真正成為人類伙伴的對話機(jī)器人。
交通大學(xué)趙海教授以《語言模型、對話系統(tǒng)和機(jī)器閱讀理解》為主題,對現(xiàn)有的對話與交互系統(tǒng)進(jìn)行了分析。目前多輪、基于事實(shí)的任務(wù)型對話系統(tǒng)是重大需求,更強(qiáng)的對話交互能力所面臨的挑戰(zhàn)在于更精準(zhǔn)的檢索與匹配、基于閱讀理解的上下文建模和個性化、多樣化的對話生成。在未來應(yīng)該將前沿的預(yù)訓(xùn)練語言模型應(yīng)用到多輪對話系統(tǒng)。
南京新一代人工智能研究院副總經(jīng)理董曉飛就《智能客服評估規(guī)范解讀與實(shí)踐》進(jìn)行了分享。智能客服產(chǎn)業(yè)已形成產(chǎn)業(yè)鏈,智能客服市場雖然競爭激烈,但一直沒有一套標(biāo)準(zhǔn)來規(guī)范。為促進(jìn)整個市場的良性競爭,健康發(fā)展,提供用戶甄別產(chǎn)品的能力。由中國信息通信研究院、南京新一代人工智能研究院牽頭,以用戶角度感知為切入點(diǎn),制定系列規(guī)范,并完成了第一輪的測評工作,在主論壇對測評通過的企業(yè)頒發(fā)證書。竹間智能很榮幸參與了本次的測評并獲得認(rèn)可。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!