當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

GAITC專題論壇丨金兼斌:虛假科學信息治理依靠社會民智,AI是整合關鍵

 2020-07-29 12:06  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

7月26日,由中國人工智能學會主辦、新浪新聞聯(lián)合浙江大學承辦的2020全球人工智能技術(shù)大會(2020GAITC)“AI時代下的新媒體與社交娛樂”專題論壇拉開帷幕,新浪集團首席信息官、新浪AI媒體研究院院長王巍,浙江大學特聘教授、悉尼科技大學教授、百度研究院訪問教授楊易共同擔任論壇主席。

清華大學大學新聞與傳播學院學術(shù)委員會主任、教授金兼斌在本次專題論壇上,與來自業(yè)界、學術(shù)界的嘉賓們分享了《人工智能助力虛假科學信息的監(jiān)測》。

圖注:清華大學大學新聞與傳播學院學術(shù)委員會主任、教授金兼斌作主題演講。

金兼斌認為,社會化媒體時代,虛假科學信息的治理,必須充分依靠對分散在社會各個平臺上的民智的整合,而人工智能則是實現(xiàn)這種有效整合的關鍵。

關于應對虛假科學信息,利用人工智能技術(shù)進行更好的監(jiān)測,他提到,基于虛假科學信息的語言特征、內(nèi)容特征和對象特征,“表示學習”、“知識圖譜”、“信息挖掘”是三種有針對性的解決思路。

以下為金兼斌演講實錄,內(nèi)容經(jīng)編輯略有刪減:

各位嘉賓好,首先非常榮幸受新浪新聞和浙江大學的邀請來參加這一論壇。剛才聽前面幾位專家分享的時候,頗感心有戚戚。諸多內(nèi)容和觀點,嘉賓之間并未事先溝通過,但卻遙相呼應。

今天我將主要談談虛假科學信息的監(jiān)測問題。借用剛才Amy Bruckman女士的話,知識本質(zhì)上是一種共識的社會建構(gòu)。尼采有類似的表述,即世界上沒有所謂的事實,只有解讀。

在日常的內(nèi)容消費中,很多時候我們面臨這樣的場景:有一定共同認可的事實基礎的現(xiàn)象或事件,不同人對事件的性質(zhì)以及可能的社會后果,可以有截然不同的解讀和判斷。諸多人與人之間、群體與群體之間、國家與國家之間的矛盾、爭執(zhí)乃至交惡、撕裂,由此而生。

7月24號,也就是兩天前,《科學》雜志上發(fā)表了一篇中科院武漢病毒研究所研究員石正麗回答《科學》的18問專訪的文章,文章題目以“特朗普欠我們一個道歉”這一來自石正麗的引語開始。提問者對所提18個問題做了精心的準備,涉及到武漢病毒所和此次新冠疫情之間有無關聯(lián)的大量專業(yè)問答,雖然字里行間不乏春秋筆法,但總體上問答雙方都十分克制,只講事實,沒有任何情緒化的表達。這是很難得的。因為在人們?nèi)粘K姷拇罅可婕翱茖W事實的各種網(wǎng)上內(nèi)容表述中,“后真相”時代觀點先行、事實成為“任人打扮的小姑娘”,已經(jīng)是見怪不怪的現(xiàn)象。這正是我今天給大家分享的這個主題的時代和信息傳播環(huán)境之大背景。

今天,科學已經(jīng)成為我們當代社會文明中的亮麗底色。另一方面,科學不光是科學,它還關乎政治,國際上圍繞疫情起源的爭議和污名化就是明證。而對普通民眾而言,科學關乎日常生活質(zhì)量和對現(xiàn)代文明帶來的福祉的享用。如何確保確保民眾日常生活接觸到的科學性信息的質(zhì)量,可謂茲事體大。

我將要介紹的內(nèi)容,是由我們團隊的博士后陳慧敏和碩士生朱澤宇與我一起準備完成的。

今天的主題是AI時代下的新媒體與社交娛樂。剛才王巍總講到內(nèi)容生產(chǎn)從PGC到UGC再到現(xiàn)在TGC的多元化趨勢。我們身處信息生產(chǎn)的社會化、大眾化乃至萬物生生不息的時代。另一方面,人作為信息消費者,又有其永遠無法逾越的一些邊界條件,比如一天只有24小時,信息消費的時間和其他活動包括睡眠所占的時間,是一種此消彼長的零和游戲。今天,社會的發(fā)展已經(jīng)從規(guī)模發(fā)展轉(zhuǎn)變到高質(zhì)量發(fā)展階段,其實信息的生產(chǎn)和消費,也必然面臨這樣的轉(zhuǎn)變。我們不缺內(nèi)容,缺的是高質(zhì)量的內(nèi)容,特別是缺由消費者特定場景所定義的高質(zhì)量內(nèi)容,包括事關國計民生的優(yōu)質(zhì)科學性內(nèi)容。

剛才Bruckman教授講到,知識本質(zhì)上是一種社會建構(gòu)。其實各種各樣的虛假科學信息背后,常常也涉及到了很多不同的價值觀和社會力量之間的話語權(quán)角逐和爭斗。諸如病毒起源、戴口罩的必要性等問題,不僅是科學性問題,當中所涉及的話語權(quán)和定義權(quán),還關乎大國博弈、防疫政策和責任歸因的選擇和感知。因為我們對世界的認知,歸根到底是受各種所消費內(nèi)容的涵化和型塑的。

也正如此,提升民眾的科學素養(yǎng),讓民眾對事關其生活質(zhì)量的各種科學性信息具有基本的鑒別能力或解惑途徑,在大力推進科技創(chuàng)新的同時,同步推進科學普及,是一體兩面的重要舉措。面對海量的信息的觸手可及,真正有用的高質(zhì)量信息如何為民所用,需要有可落地的方案。而有效監(jiān)測民眾每日接觸到的內(nèi)容中的虛假科學信息并及時加以提醒、清除、糾錯糾偏,是社會良治中信息治理的題中之義。

無論是科學信息的生產(chǎn)還是虛假科學信息的監(jiān)測,社會化協(xié)同都是核心機制。就科學信息的生產(chǎn)而言,不同機構(gòu)、領域的專家或科技工作者通過專業(yè)發(fā)表和圈層日常交流,把科學信息源源不斷輸出到整個社會的信息傳播系統(tǒng)中。另一方面,科學信息在通過媒體特別是社會化媒體的多層、多級傳播過程中,大量民眾既作為內(nèi)容的消費者又作為內(nèi)容的傳播者參與生產(chǎn),這一過程降低了科學信息的生產(chǎn)和傳播的門檻。這是我們進行虛假科學信息監(jiān)測所面對的信息生態(tài)環(huán)境。

下面我們首先把虛假科學信息的信息特征做一個簡單的梳理。我們從三個方面進行總結(jié),包括語言特征、內(nèi)容特征和對象特征。

首先是語言特征。虛假科學信息常常有一些明顯的語言表達方式上的特征,比如“長期服用降壓藥會致死”這類說法,其陳述中通常特別強調(diào)致死、致癌、致殘這一類嚴重后果。從傳播學的角度來看,這樣的傳播策略叫訴諸恐懼。這類信息在涉及有關可能風險時,常??浯笃湓~,或者斷章取義,典型如離開劑量談毒性。事實上,鑒別社會化媒體上司空見慣的各種食藥品風險內(nèi)容,一定要和具體人群和應用場景結(jié)合起來,才有意義。

還有一種常見的表述,是對某類疾病或危害的簡單歸因,即科學方法論上所說的還原論謬誤。這種表述常常有意無意混淆可能性和必然性之間的差異,把多種原因?qū)е碌默F(xiàn)象,簡單歸咎于某一特定因素。比如“常吃米飯會誘發(fā)糖尿病”這類聳人聽聞的說法,背后就是一種還原論邏輯。

第二是內(nèi)容特征。虛假科學信息的內(nèi)容,不同于一般的虛假信息之處在于,其所關涉的事實是否準確,涉及到科學性和專業(yè)性知識或邏輯判斷問題,而在這方面,虛假科學信息可以巧妙地布下很多認知陷阱,在似是而非間,混淆是非,誤導人們的認知和行為。如“食鹽含亞鐵*,不可食用”的說法,首先是有意引導民眾把亞鐵*和*進行聯(lián)想置換,產(chǎn)生恐懼。亞鐵*跟*是不一樣。其次,食鹽中只含有的極為微量的亞鐵*,一般人每天食用的食鹽量里面包含的亞鐵*,完全不會對人體構(gòu)成健康危險。但這些相對專業(yè)的知識和邏輯,可能并不為普通民眾所熟悉和了解。

第三是對象特征。很多虛假科學信息或者科學謠言的描述對象,常常是一些新興事物,如“量子波動速讀”“5G基站可致癌”“雙黃連可防新冠病毒”等流言或謠言,其中涉及的事物都比較新,超出大部分民眾的知識儲備。媒體或民眾對其真?zhèn)谓柚延兄R難以辨識,于是就會有寧可信其有不可信其無的心理,導致以訛傳訛。

如何進行虛假信息的鑒別或監(jiān)測?基本上有兩種思路,即人工鑒別和機器鑒別。當然在辟謠實踐中,常常是兩種方法結(jié)合起來的,即機器快速從海量、動態(tài)的信息中定位到一些可疑內(nèi)容,然后通過一系列知識體系、專家系統(tǒng)和人工方法,來判定有關信息的真?zhèn)巍V档弥赋龅氖?,兩種方式各有優(yōu)劣。機器識別效率高,但難以精準識別專業(yè)性較高的前沿科技內(nèi)容,所以有時仍需要依賴人工;人工識別包括專家解讀的優(yōu)勢在于,可以判別一些現(xiàn)有文獻和知識庫中尚未有明確論述的一些新興科學性內(nèi)容表述的真?zhèn)危缧鹿诓《颈l(fā)以來,伴隨病毒傳播的還有諸多虛假科學信息。由于人們對新冠病毒的性質(zhì)的認知也有一個過程,因此,當有關新冠病毒特性的一些科學流言和謠言出現(xiàn)時,依賴已有的知識體系來進行機器識別,注定是不可靠的,而是需要仰仗一線醫(yī)務工作者和科學家的最新研究發(fā)現(xiàn)和臨床經(jīng)驗才能判斷真?zhèn)?。當然人工鑒別的缺點是效率低。因此,兩者需要有機結(jié)合。

下面是我針對我們前面對虛假科學信息三個方面特征的總結(jié)梳理,談談人工智能助力虛假科學信息監(jiān)測的解決思路。

基于虛假科學信息的語言特征,我們可以采用表示學習技術(shù),來對海量動態(tài)的內(nèi)容中的虛假科學信息進行快速的初步定位和識別。通過表示學習,把待判別文本轉(zhuǎn)化為低維度向量,隨后利用深度神經(jīng)網(wǎng)絡,學習這些向量表示中的信息,達到快速進行語義分析的目的?;谡Z言特征進行的語義分析技術(shù),目前相對來說已經(jīng)比較成熟。這是進一步對有關內(nèi)容科學性進行判別的前提,即我們首先需要讓機器知道有關內(nèi)容的主題和觀點具體是什么。

基于內(nèi)容特征,我們可以借助知識圖譜作為破解虛假科學信息的途徑。知識圖譜是人類已有知識的精華,是人類構(gòu)建的知識網(wǎng)絡,網(wǎng)絡里的每個節(jié)點就代表了某一個概念,而節(jié)點之間的連邊,就代表了這些概念之間的關聯(lián)。我們可以將知識圖譜和神經(jīng)網(wǎng)絡結(jié)合,識別虛假科學信息,即從待判別文本中,抽取出重要的概念以及概念之間的關聯(lián),并與知識圖譜中這兩個概念對應的實體節(jié)點之間的關聯(lián)路徑進行對比,看看待判別文本中概念之間的關聯(lián)性(如“轉(zhuǎn)基因食品”引發(fā)“癌癥”這一表述)的真?zhèn)位虼嬖诘目赡苄浴T诳茖W謠言的判別中,大部分謠言內(nèi)容的破解,利用知識圖譜能夠高效地進行。

基于虛假科學信息的對象特征,即有關話題對象或主題通常較新,科學性和專業(yè)性較強,我們提出多層次信息挖掘這樣一個思路和對策。

所謂多層次,根據(jù)廣義上的“知識圖譜”之“知識”的成熟度,我們區(qū)分了正式出版的文獻、預印本平臺內(nèi)容、以及各種知識問答類眾包平臺。典型的出版文獻通常是經(jīng)過同行評審的,其包含的概念和知識體系相對比較成熟、自洽,大致和上述通常意義上的“知識圖譜”中的來源知識對應;鑒于正式出版的審稿、修改周期通常比較長,而諸如新冠疫情這樣的公共衛(wèi)生問題又人命關天十分緊急,因此,近年來興起一種預印本發(fā)布制度,讓很多前沿研究成果可以第一時間可以為同行甚至媒體知曉和參考,雖然其中的內(nèi)容和結(jié)論可能存在出錯風險,但在對有關新問題、新挑戰(zhàn)缺乏更好認知和對策的情況下,聊勝于無,預印本平臺上看似不一定“成熟”的內(nèi)容,對于有關新興科學主題的信息真?zhèn)蔚恼鐒e,仍可能起到極有價值的參考作用。最后就是知識問答類眾包平臺,以及廣義上存在于各種論壇、圈層上針對有關新興、前沿問題的專業(yè)內(nèi)容探討和分享,理論上,這部分內(nèi)容也應該作為一個社會知識生產(chǎn)的一種機制,納入到虛假科學信息鑒別可資參考和依賴的來源中。我們可以想象,在未來的某一天,我們的人工智能發(fā)展到這樣一種理想的水平,即每一個用戶在其生活場景中遇到的每一個不知真?zhèn)蔚目茖W問題,都可以第一時間通過諸如語音搜索引擎這種方式,向全網(wǎng)或全社會詢問或求助;而全網(wǎng)或全社會也能在第一時間,把對這個問題的最新、最優(yōu)、最權(quán)威認知,以提問者所能理解的方式回應給他,實現(xiàn)無縫交互。借助于無所不在的像神經(jīng)網(wǎng)絡一樣的社會信息傳播系統(tǒng),一個社會通過人工智能,最終得以把整個社會的民智進行有效的萃取整合。由此,整個社會的知識和智慧,真正成為每一個個體予求予取的外腦般的不竭源泉。到那個時候,無論虛假信息如何千變?nèi)f化深藏不露,都將被人們輕易鑒別。

顯然,我們離這一天還比較遙遠。要實現(xiàn)這樣的一幅理想圖景,我們不僅需要整合知識,還需要協(xié)調(diào)社會不同民眾的價值觀,即對事實的解讀。不僅涉及到對知識的整合,還涉及到對一個社會倫理價值道德觀念的整合,體現(xiàn)一個社會的集體理性和智慧。因此,從根本意義上言,這種多層次信息挖掘和綜合研判,是對全社會智慧的有效整合。

總結(jié)而言,我們提出了這樣一套基于人工智能進行虛假科學信息監(jiān)測的框架和思路?;谡Z言特征,機器學習和語義分析可以幫助我們識別海量內(nèi)容中科學性方面可疑的信息,這方面的人工智能技術(shù)現(xiàn)在已經(jīng)比較成熟?;趦?nèi)容特征的檢測,利用已有的知識圖譜,可以比較高效的解決大量的虛假科學信息的識別問題,但是它可能不能解決層出不窮的新興話題的真?zhèn)闻袛鄦栴}?;趯ο筇卣鞯亩鄬哟涡畔⑼诰?,通過對分散在社會不同系統(tǒng)和平臺上的知識體系和認知主體的智慧集成,理論上,我們可以對各種各樣的虛假科學信息的鑒別需求作出快速回應。

值得強調(diào)的是,這個過程不僅涉及知識鑒別,還涉及到社會層面的組織和協(xié)同。事實上,大數(shù)據(jù)和社會化媒體的發(fā)展,一方面具有對普通民眾和整個社會進行賦能的潛力;另一方面,大量虛假、不實信息充斥其中,也使得有效信息的甄別和利用成為新的挑戰(zhàn),賦能不當,可能徒耗民眾的精力、時間和資源,變成耗能。這不是一個小問題。如我一開始所言,科學信息不光是科學,它還可能關涉到政治和經(jīng)濟,關乎大國之間的博弈和競爭,涉及到普通人的日常生活,因此,如何進行一個社會的信息良治,值得我們投入更多的關注。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 盤古大模型,不一樣的「煙火氣」

    文/八真出品/節(jié)點商業(yè)組2023年已過半,但AI大模型依舊熱的發(fā)燙。科技部新一代人工智能發(fā)展研究中心的《中國人工智能大模型地圖研究報告》顯示,迄今為止,中國已發(fā)布79個10億參數(shù)規(guī)模以上的大模型。與此同時,伴隨著越來越多的選手謀局落子和下場奪舍,把這場摧枯拉朽的科技盛典推向高潮,更多人開始思考,AI

    標簽:
    ai技術(shù)
  • PRINS.AI榮獲2023SAIL之星

    PRINS平臺被世界人工智能大會授予2023年人工智能行業(yè)著名的SAIL之星。這證明了公司在AI人工智能方面所做的努力。PRINS(PRINSAITechnologyLtd)是一家專注于虛擬體驗技術(shù)解決方案的技術(shù)公司,由人工智能研究人員和技術(shù)專家組成的核心團隊創(chuàng)立。目前已獲得多家知名投資機構(gòu)的投資,

    標簽:
    ai技術(shù)
  • AI+軟件,為什么可以看多用友?

    文/七公出品/節(jié)點商業(yè)組2023年,“ChatGPT”的問世讓人工智能(AI)空前興奮和繁盛。有人高呼這是“iPhone時刻”,有人振臂這是第四次工業(yè)革命,也有人驚嘆這是新一代的“火”和“電”??偠灾?,這場史無前例的大變革,正在復刻2015年前后的“互聯(lián)網(wǎng)+”行情,推動“AI+”成為未來十幾年的發(fā)

    標簽:
    ai技術(shù)
  • 匯聚中國AI頂尖力量 云天勵飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運營商、科研院所等優(yōu)秀團隊

    標簽:
    ai技術(shù)
  • 用友大易:邁入AI招聘2.0時代,讓人力資源回歸本質(zhì)

    這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓練模型來實現(xiàn)圖像識別、聲音識別、語言處理等特

    標簽:
    ai技術(shù)

熱門排行

信息推薦