當前位置:首頁 >  科技 >  數(shù)碼 >  正文

清華馬少平教授:搜狗翻譯寶Pro強在大數(shù)據(jù)

 2018-09-19 15:30  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

月19日,搜狗正式對外發(fā)布新的智能翻譯硬件——搜狗翻譯寶Pro。多場景的翻譯測試數(shù)據(jù)顯示,搜狗翻譯寶Pro的準確度評分遠超世面主流翻譯產(chǎn)品。中國人工智能學會副理事長、清華大學馬少平教授對此表示,“大數(shù)據(jù)語料”是決定智能翻譯“聽懂、看懂、說清”的關(guān)鍵,而這正是搜狗翻譯寶Pro的優(yōu)勢所在。

另據(jù)了解,搜狗翻譯寶Pro離線翻譯支持中英日韓4種語言互譯,在線翻譯可支持法語、阿拉伯語、德語、意大利語、西班牙語等42種語言互譯,覆蓋200多個國家。同時,搜狗翻譯寶Pro還加入了實景拍照翻譯功能,能幫助用戶準確識別點餐、問路等各種場景下的文字信息。尤為值得一提的是,搜狗翻譯寶Pro離線翻譯與云端翻譯結(jié)果基本無差異。這也是其區(qū)別于市面上其他競品的又一亮點。

當前,隨著通信技術(shù)的不斷發(fā)展,語言對溝通產(chǎn)生的阻礙越發(fā)明顯,包括谷歌、微軟、Facebook、搜狗、騰訊等各大科技公司都在發(fā)力智能翻譯技術(shù),市場上的翻譯機產(chǎn)品也如雨后春筍一般涌現(xiàn)。但這些翻譯軟件、翻譯機的實際效果卻并不盡如人意。此前曾有評測報告顯示,這些翻譯APP和“翻譯機”將外語翻譯成中文時的準確率非常低。

馬少平認為,智能翻譯必須以大數(shù)據(jù)語料做支持。如果機器翻譯缺乏大數(shù)據(jù)支持,就只能按照既定的語法規(guī)則將詞匯組織起來,無法領(lǐng)會語言的自然性和多義性。這種情況下,翻譯出的結(jié)果通常不符合語言的習慣表達方式,基本不能直接使用。

數(shù)據(jù)顯示,搜狗每天語音請求次數(shù)在3 億次,每天可以收回大概24萬小時的語料數(shù)據(jù)。中國人工智能學會和IEEE會員、北京郵電大學計算機學院教授石川對此也表示,任何一項人工智技術(shù)的發(fā)展都離不開大數(shù)據(jù)。智能翻譯領(lǐng)域也不例外,得語料者才能得天下。搜狗在此方面的優(yōu)勢保證了搜狗翻譯寶Pro能在眾多智能翻譯硬件中脫穎而出。

大數(shù)據(jù)語料之外,強大的人工智能技術(shù)加持是搜狗翻譯寶Pro能夠在眾多競品中脫穎而出的又一原因。作為中國知名的互聯(lián)網(wǎng)企業(yè),搜狗多年來一直在人工智能領(lǐng)域展開投入,并完成了全球獨創(chuàng)的神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)。該技術(shù)曾在國際學術(shù)賽事WMT2017中獲得中英機器翻譯全球第一。

此次,搜狗翻譯寶Pro就采用了該技術(shù),并以深度循環(huán)神經(jīng)網(wǎng)絡(luò)編碼解碼框架技術(shù)作為主要技術(shù),使用完全端到端的學習方式。獨特的人工智能技術(shù)和大數(shù)據(jù)語料的融合,不僅保證了搜狗翻譯寶Pro離線和在線翻譯的準確度,真正解決了用戶聽不懂、看不懂、說不出的問題,也保證了整個翻譯決策過程的連續(xù)性,使得翻譯出的句子在流暢度上更優(yōu)異。

專家們表示,2018年以來,中外各大互聯(lián)網(wǎng)企業(yè)都在紛紛布局智能翻譯市場。搜狗翻譯寶Pro的推出標志著智能翻譯正式進入“智能”賽道。而智能翻譯硬件有可能成為AI消費硬件的第一枚果實。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標簽
搜狗翻譯
在線翻譯

相關(guān)文章

熱門排行

信息推薦