文 ▍李東樓(微信號:lidonglou)
在美國導演斯派克·瓊斯編劇并執(zhí)導的一部科幻愛情片《她》(Her)當中,語音交互幾乎成為了人們與手機、電腦等設備進行交互的唯一手段,打電話、寫信、處理工作郵件等等,都通過語音向計算機發(fā)出指令。而且其中的人工智能操作系統(tǒng)OS1還與人類有了情感交流,談起了戀愛,而影片的背景被設定在2025年,也就是從現(xiàn)在算起九年之后。
當然,我們無法預測,人工智能在九年后究竟會不會發(fā)達到這個地步?但眼下可以肯定的是,人工智能技術確實已經(jīng)開始從實驗室逐步走近我們的生活,尤其是今年年初的谷歌alphago圍棋機器人和李世石的人機對決大戰(zhàn),更是讓人們首次見識到人工智能的強大之處。而在昨天,搜狗語音發(fā)布了不僅“能聽會說”,還具有“能理解會思考”的能力的語音交互引擎技術—知音,這再次刷新了在場所有人對于人工智能技術發(fā)展的認知。
搜狗知音引擎發(fā)布,展現(xiàn)搜狗在人工智能方面的自信
就如同影片《她》當中,男主人公通過語音寫信一般,基于語音識別和語義理解技術方面的進步,搜狗語音早已達到了可以實時轉(zhuǎn)寫的地步。值得一提是,在昨天的發(fā)布會上,嘉賓的發(fā)言就通過搜狗知音交互引擎實時轉(zhuǎn)寫并呈現(xiàn)在大屏幕上,不僅語音識別速度快,而且準確率也相當高,基本上能夠達到90%以上,令人驚嘆技術的進步。
而這還只是搜狗知音引擎的簡單“炫技”,除了語音識別之外,根據(jù)搜狗CTO楊洪濤介紹,搜狗知音引擎還支持用戶直接用自然語言進行糾錯,比如用戶可以說:“把‘張’修改為立早‘章’,或者把‘張’修改為文章的’章’。并且還支持多輪對話,比如用戶說我要去首都機場,搜狗知音引擎便會問 T1還是 T2,當用戶確定航站樓后,它會問是出發(fā)還是接人。這就意味著搜狗知音引擎能夠處理更加復雜的交互邏輯,以及更好的感知用戶語音請求背后的真正需求,這顯然語音交互方面的一大技術進步。
要知道,在兩年前,尤其是蘋果Siri的推出,語音交互作為一種面向未來的交互方向,就備受各大互聯(lián)網(wǎng)公司的重視和看好。包括搜狗、百度、微軟等科技公司都推出了語音助手產(chǎn)品,期待產(chǎn)品能夠作為移動互聯(lián)網(wǎng)的一大入口。不過,現(xiàn)在看來,無論是Siri,還是微軟的小娜,都在用戶短暫的熱捧之后,漸漸沉默。事實上,這其實算是第一代的人工智能初級產(chǎn)品,這些產(chǎn)品更多的是扮演著一個小助手或者秘書的角色,只能夠簡單的處理一些打電話、發(fā)短信、天氣預報查詢等等,一旦遇到稍微復雜的問題,語音助手便無法處理,一般都只好賣萌?;@就使得產(chǎn)品的實用性并不強,用戶嘗試使用更多的是抱著娛樂的心態(tài),而并不是真正的剛性需求。
不過,時隔兩年之后,各大科技公司的語音交互技術有了顯著的提升。尤其是在這次搜狗發(fā)布的語音交互引擎技術當中更能夠感受到技術的進步之快。根據(jù)了解,目前搜狗的語音交互引擎技術已經(jīng)應用在包括搜狗輸入法、搜狗搜索、搜狗地圖等在內(nèi)的搜狗全線產(chǎn)品當中,而根據(jù)搜狗語音交互中心負責人王硯峰在現(xiàn)場的演示,運用在搜狗搜索、搜狗地圖導航等應用上的搜狗語音交互引擎技術,在語音識別率以及多輪語音交互的處理等方面,已經(jīng)顯著領先于競爭對手。
而且,這并不是搜狗第一次展現(xiàn)自己在智能語音方面的技術能力,以及布局人工智能技術的決心。在今年6月份的搜狗輸入法十周年上,搜狗CEO王小川就提出了將人工智能定位搜狗輸入法的下一階段戰(zhàn)略發(fā)展的新方向,搜狗CTO楊洪濤則首次透露了搜狗輸入法的快速分享、聰明回復和妙筆修飾等目前正在研發(fā)的三個能夠增強用戶表達能力的人工智能新技術;而在7月份剛剛結(jié)束的奇點創(chuàng)新者峰會上,搜狗CEO王小川更是直接邀請一名現(xiàn)場觀眾上臺直接演示完全通過自然語音來發(fā)送一段短信息,這也體現(xiàn)了搜狗在其人工智能技術方面的強大自信。
搜狗知音引擎發(fā)布背后,搜狗早有“預謀”
另一方面,盡管搜狗今年才開始陸續(xù)對外展示自己在人工智能技術實力,但顯然搜狗在人工智能的研究和布局并不是剛剛開始。實際上,搜狗在人工智能領域的研究和布局早已開始,搜狗CTO楊洪濤在知音交互引擎發(fā)布會上就透露:“搜狗從12年開始研發(fā)智能語音技術,并在13年開始進行深度學習,自然交互和知識計算是搜狗在人工智能領域的兩大戰(zhàn)略方向,目前搜狗在人工智能領域的研發(fā)已經(jīng)全面展開。”
搜狗在人工智能領域的布局不僅起步早,而且與谷歌、百度等搜索引擎公司一樣,屬于天生就擁有人工智能基因的公司。這是因為搜索引擎擁有海量的搜索數(shù)據(jù),而通過數(shù)據(jù)挖掘之后,便能夠?qū)崿F(xiàn)人工智能的最后一個階段-機器深度學習。也因如此,我們看到,谷歌不僅推出了圍棋機器人alphago,更是在更名為Alphabet后,全面轉(zhuǎn)型成為了人工智能公司;而百度同樣將人工智能作為其未來的一大發(fā)展方向。搜狗則在今年第一季度發(fā)布財報時,由搜狗CEO王小川首次明確其成為“中國人工智能領域的創(chuàng)新者和領先公司”的決心和野心。而與此相伴隨的則是在人工智能技術方面的大手筆投入。最具有代表型的便是,今年4月份向清華大學捐贈1.8億元,與其聯(lián)合成立“清華大學天工智能計算研究院”,深入開展人工智能領域的前沿技術研究。這意味著搜狗開始全面從搜索引擎公司升級成為人工智能公司。
實際上,搜狗之所以能夠在智能語音技術方面能夠如此大的突破,除了具有人工智能基因和提早布局之外,更重要的還是要歸功于搜狗在此前十幾年的過程中,積累的數(shù)億用戶以及由此每天產(chǎn)生的海量交互數(shù)據(jù),而這些為機器學習提供了優(yōu)秀的“土壤”,也使得人工智能越來越聰明。搜狗語音交互引擎這一成果取得的背后,顯然離不開日均語音搜索次數(shù)增長超過4倍的搜狗搜索和擁有海量詞庫、日均語音輸入超過1.4億次的搜狗手機輸入法,正是這兩大產(chǎn)品聯(lián)手讓搜狗智能語音成為目前國內(nèi)語音輸入功能使用量最大的移動手機產(chǎn)品,而這就意味著搜狗的語音交互技術有更多的“學習”機會。
不過,盡管搜狗語音交互引擎技術在當下已經(jīng)足夠讓人驚艷,但是離電影《她》當中所描述的人工智能場景還有距離。比如《她》當中人工智能OS1除了幫助處理工作和生活瑣事之外,還能夠與人類戀愛,并深刻理解人類復雜的感情。顯然,現(xiàn)在通過自然語言實現(xiàn)人機交互只是人工智能的第一步,未來真正實現(xiàn)擬人化的交流甚至更高級的情感交流才是更高的境界,也因如此,下一次搜狗們能夠推出什么樣的驚艷的產(chǎn)品或技術就更值得期待。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!