域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過
日前,由搜狗搜索聯(lián)合中國(guó)中文信息學(xué)會(huì)(CIPS)共同舉辦的“CIPS-SOGOU問答比賽”正式啟動(dòng)報(bào)名。作為國(guó)內(nèi)首檔基于大規(guī)模真實(shí)用戶問答數(shù)據(jù)集的問答評(píng)測(cè)任務(wù),此次大賽的舉辦,不僅能為參賽者提供挑戰(zhàn)及展示能力的舞臺(tái),還將促進(jìn)學(xué)術(shù)界及業(yè)界在智能問答領(lǐng)域的研究發(fā)展,推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。
此次問答比賽分為事實(shí)型問答和非事實(shí)型問答兩項(xiàng)子任務(wù)。按照賽制,參賽者需要根據(jù)給定的問題設(shè)計(jì)算法,從候選篇章中抽取合適的詞語、短語或句子,作為問題的標(biāo)準(zhǔn)答案,能夠?qū)崿F(xiàn)正確、完整、簡(jiǎn)潔地回答問題。每個(gè)問題對(duì)應(yīng)給出10個(gè)候選答案篇章,每個(gè)篇章約50 - 500個(gè)漢字。
在評(píng)測(cè)指標(biāo)方面,事實(shí)型問答子任務(wù)將采用Accuracy和Precision-Recall(F1)指標(biāo)對(duì)*進(jìn)行評(píng)價(jià),其中Accuracy計(jì)算*和標(biāo)準(zhǔn)答案是否精確匹配,F(xiàn)1計(jì)算*相對(duì)標(biāo)準(zhǔn)答案的詞級(jí)重合度,以兩者平均值作為最終指標(biāo)。非事實(shí)型問答子任務(wù)采用ROUGE和BLEU指標(biāo)對(duì)*進(jìn)行綜合評(píng)價(jià)。
據(jù)悉,此次比賽的事實(shí)型問答子任務(wù),將從9月1日起開始提交報(bào)名,有興趣參賽的高校生、業(yè)內(nèi)研究人員等,可通過“搜狗實(shí)驗(yàn)室”官網(wǎng)提交報(bào)名信息。非事實(shí)型問答子任務(wù),則將在12月中旬開始接受提交報(bào)名,并陸續(xù)公布比賽數(shù)據(jù)集和Leaderboard。在2018年CIPS的學(xué)術(shù)年會(huì)上,將會(huì)對(duì)兩項(xiàng)子任務(wù)中勝出的團(tuán)隊(duì)進(jìn)行頒獎(jiǎng)。
值得一提的是,作為聯(lián)合主辦方的搜狗搜索,將向大賽提供來自搜索引擎的大規(guī)模真實(shí)用戶問答數(shù)據(jù)集。其中,6萬個(gè)問題(事實(shí)型問題3萬、非事實(shí)型問題3萬),代表了最真實(shí)廣泛的網(wǎng)民信息需求;60萬對(duì)應(yīng)問題的候選篇章,來自搜索引擎返回的若干互聯(lián)網(wǎng)頁面;而經(jīng)過對(duì)頁面進(jìn)行人工分析標(biāo)注,搜狗搜索構(gòu)建了針對(duì)問題的標(biāo)準(zhǔn)答案,最終形成大規(guī)模、極具價(jià)值的問答數(shù)據(jù)集。
據(jù)了解,目前在智能問答研究領(lǐng)域,可用的大規(guī)模公開數(shù)據(jù)集,尤其是反映真實(shí)用戶問答需求的中文數(shù)據(jù)集非常稀缺。業(yè)界和學(xué)術(shù)界受限于技術(shù)、數(shù)據(jù)等因素,當(dāng)前的研究主要針對(duì)“事實(shí)型問答”領(lǐng)域,而在與用戶搜索場(chǎng)景息息相關(guān)的“開放域智能問答”領(lǐng)域則一直無法取得突破性進(jìn)展。搜狗搜索此次公開的大規(guī)模數(shù)據(jù)集,不僅能促進(jìn)“CIPS-SOGOU問答比賽”的正常開展,還能將給整個(gè)智能問答行業(yè)的研究發(fā)展提供寶貴的數(shù)據(jù)支撐,從而推動(dòng)智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務(wù)。
事實(shí)上,憑借在人工智能領(lǐng)域的持續(xù)投入及搜索引擎的數(shù)據(jù)優(yōu)勢(shì),搜狗搜索目前在智能問答領(lǐng)域已處于行業(yè)領(lǐng)先地位。搜狗搜索此前已上線的“立知”智能問答系統(tǒng),就是搜狗研發(fā)的面向未來的搜索技術(shù)。該系統(tǒng)能夠理解用戶搜索意圖和問題,直接為用戶提供想要的答案。目前“立知”智能問答系統(tǒng)不僅能精準(zhǔn)回答事實(shí)性問題,在分析類問題、觀點(diǎn)類問題、數(shù)字類問題、隱式問題等方面,都能直接返回精確答案,背后應(yīng)用了語義分析、問題理解、信息抽取、知識(shí)圖譜、信息檢索、深度學(xué)習(xí)等眾多人工智能技術(shù)。
作為智能問答領(lǐng)域的引領(lǐng)者,搜狗搜索在切實(shí)推進(jìn)產(chǎn)品落地、為用戶帶來優(yōu)質(zhì)搜索體驗(yàn)的同時(shí),也注重向行業(yè)開放問答能力,不斷推動(dòng)業(yè)界及學(xué)術(shù)界的研究發(fā)展。今年4月份,搜狗搜索曾聯(lián)合CCIR 2017(2017全國(guó)信息檢索學(xué)術(shù)會(huì)議)成功舉辦了國(guó)內(nèi)首次大規(guī)模真實(shí)用戶問答數(shù)據(jù)集上的問答評(píng)測(cè)任務(wù)——首屆“面向智能問答的篇章排序”評(píng)測(cè)比賽,并公開了來自用戶真實(shí)搜索需求的5萬個(gè)問題以及從搜狗搜索全網(wǎng)檢索結(jié)果提供的50萬條候選篇章,極大促進(jìn)了智能問答技術(shù)的發(fā)展和應(yīng)用。
相比“面向智能問答的篇章排序”評(píng)測(cè)比賽,此次“CIPS-SOGOU問答比賽”的賽制、公開數(shù)據(jù)集等都將進(jìn)行全新升級(jí),將會(huì)在更大程度上促進(jìn)智能問答領(lǐng)域的學(xué)術(shù)交流和研究水平。對(duì)此次問答評(píng)測(cè)比賽感興趣的高校生或業(yè)內(nèi)從業(yè)者,均可報(bào)名參加。
報(bào)名鏈接:
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!