文:劉志剛@互聯(lián)網(wǎng)江湖主編
如果說近二十年來有哪一項(xiàng)科技成果能夠媲美上個(gè)世紀(jì)電腦的發(fā)明,那么這份榮譽(yù)一定屬于基于深度學(xué)習(xí)算法的AI技術(shù),因?yàn)閷W(xué)習(xí)算法的誕生,才使得信息時(shí)代海量信息與數(shù)據(jù)第一次能夠完整的為人們提供可商業(yè)化的價(jià)值,并將由此開啟人類的“人工智能”時(shí)代。
但踏入人工智能時(shí)代的人們?cè)讷@取諸多技術(shù)革新成果的同時(shí)也付出了自己的代價(jià):在這個(gè)數(shù)據(jù)即生產(chǎn)力的時(shí)代,與互聯(lián)網(wǎng)時(shí)刻鏈接的我們正在數(shù)據(jù)AI的時(shí)代中不停地“裸奔”。
AI智能,算法,和數(shù)據(jù)
如今,隨處可見的智能手機(jī)、街頭監(jiān)控、地鐵安檢等設(shè)備都不同程度上集成了AI技術(shù),而事實(shí)上,當(dāng)下的“AI智能”只是在線性規(guī)劃法則下算法對(duì)大數(shù)據(jù)的高效“檢索”的結(jié)果,并通過深度學(xué)習(xí)不斷完善“檢索模式”和“反饋模式”,不具備真正獨(dú)立思考能力,因而也被稱為“弱人工智能”或者“輕人工智能”。
然而,即便是不具備思考能力的AI,在海量數(shù)據(jù)的分析與處理上相比人力而言仍然具有“革命性”的優(yōu)勢。而數(shù)據(jù)、算法、算力作為數(shù)據(jù)驅(qū)動(dòng)的“準(zhǔn)人工智能”的三大要素則決定著AI的能力上限以及價(jià)值空間,其中,算法、算力是數(shù)據(jù)載體,如果將AI算法比作是一臺(tái)引擎,那么數(shù)據(jù)本身則是AI的“燃料”。
對(duì)于大數(shù)據(jù),百度百科這樣定義:“指無法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。”IBM則通過5V來表示大數(shù)據(jù)的特點(diǎn),即:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價(jià)值密度)、Veracity(真實(shí)性)。
AI與數(shù)據(jù)的聯(lián)系尤為緊密,一方面,大數(shù)據(jù)為AI提供數(shù)據(jù)資源,使其不斷成長進(jìn)化,另一方面,AI通過數(shù)學(xué)模型分析,對(duì)龐大的數(shù)據(jù)庫進(jìn)行分析檢索,充分發(fā)掘數(shù)據(jù)背后的潛在價(jià)值。維克托.邁爾-舍恩伯格在《大數(shù)據(jù)時(shí)代》中這樣描述道:“大數(shù)據(jù)提供的不是最終答案,只是參考答案,為我們提供暫時(shí)的幫助,以便等待更好的方法和答案出現(xiàn)。這也提醒我們?cè)谑褂眠@個(gè)工具的時(shí)候,應(yīng)當(dāng)懷有謙恭之心,銘記人性之本。”
“數(shù)據(jù)AI”與個(gè)人隱私的“二元對(duì)立”
毫無疑問的是,如今已經(jīng)逐步應(yīng)用的“數(shù)據(jù)AI”技術(shù)已經(jīng)很大程度上為我們的生活創(chuàng)造了巨大的便利,如線下人臉識(shí)別支付系統(tǒng)的便捷性體驗(yàn)、安防領(lǐng)域的AI人臉識(shí)別應(yīng)用有效提高安檢效率,基于用戶數(shù)據(jù)畫像的數(shù)字化營銷等?;?ldquo;數(shù)據(jù)AI”人們得以實(shí)現(xiàn)有效的風(fēng)險(xiǎn)管控以及行為預(yù)測,而伴隨著“數(shù)據(jù)AI”的商業(yè)化應(yīng)用,人們?cè)谙硎鼙憷耐瑫r(shí)也在承擔(dān)著隱私泄露的風(fēng)險(xiǎn)和擔(dān)憂。
試想一下,在數(shù)據(jù)的世界里,最了解你家庭和你社交關(guān)系的可能是你習(xí)慣性使用的社交軟件,最了解你財(cái)務(wù)狀況的可能是你常用的支付軟件,而知道你購物習(xí)慣和消費(fèi)你能力的則是你常常網(wǎng)購的平臺(tái),如果將這些數(shù)據(jù)綜合起來,則是一個(gè)完整、精確的數(shù)據(jù)畫像,這些數(shù)據(jù)一旦泄露,將使你“*”完完全全暴露在數(shù)據(jù)的世界中,被陌生人窺視,甚至被用于非法的商業(yè)交易。
此前據(jù)《華爾街日?qǐng)?bào)》報(bào)道,一位英國某集團(tuán)子公司CEO接到“老板”電話,要求其必須在一個(gè)小時(shí)內(nèi)轉(zhuǎn)賬給某“供應(yīng)商”,成功被使用AI語音克技術(shù)的犯罪分子騙取22萬歐元,
不僅AI語音存在著隱私以及安全性問題,事實(shí)上,AI視頻換臉也同樣有著隱私安全漏洞。以最近刷屏的AI換臉APP:ZAO為例,隨著熱度的飆升,其廣為詬病的用戶協(xié)議以及換臉合成視頻的隱私安全問題也使其陷入輿論的漩渦。究其本因是因?yàn)閾Q臉合成視頻觸及了人們心中的隱私紅線:當(dāng)視頻也可偽造之時(shí),還有什么樣的證據(jù)辨別真實(shí)?
目前AI技術(shù)的發(fā)展需要人們開放數(shù)據(jù),而另一方面,在現(xiàn)實(shí)中個(gè)人數(shù)據(jù)開放必然會(huì)導(dǎo)致數(shù)據(jù)泄露的風(fēng)險(xiǎn)。目前,大多公司通過其軟件搜集用戶信息必須通知用戶和取得用戶同意,而據(jù)一份調(diào)查統(tǒng)計(jì)顯示,如果要充分閱讀隱私條款則意味著每年消費(fèi)者需要多花花費(fèi)200個(gè)小時(shí)以上的時(shí)間,顯然沒有人愿意在這件事情上浪費(fèi)自己的時(shí)間。
從本質(zhì)上來看,數(shù)據(jù)開放與隱私保護(hù)二者之間原本就是二元對(duì)立的雙方,一方的收益必定意味著另一方的風(fēng)險(xiǎn)和損失,而就現(xiàn)階段來看來,并沒有一種有效的“數(shù)據(jù)黑盒”機(jī)制來保證個(gè)人數(shù)據(jù)的絕對(duì)安全。而對(duì)于剛進(jìn)入人工智能時(shí)代的人們來說,數(shù)據(jù)的開放也成為一種“趨勢”,在數(shù)據(jù)生產(chǎn)力的時(shí)代中,由數(shù)據(jù)整合、流通、數(shù)據(jù)反饋等為主體的“數(shù)據(jù)價(jià)值創(chuàng)造”將帶來飛躍式的效率提升。
數(shù)據(jù)價(jià)值與隱私權(quán)利的動(dòng)態(tài)均衡“妥協(xié)”
人們對(duì)于數(shù)據(jù)的泄露的擔(dān)憂源自于對(duì)切身利益的擔(dān)憂,事實(shí)上,開放數(shù)據(jù)的人們也同樣可以獲得AI帶來的便利服務(wù),一份調(diào)查顯示,在對(duì)自身沒有任何影響,且能保證數(shù)據(jù)絕對(duì)安全的情況下,還是有相當(dāng)一部分人愿意分享涉及隱私的相關(guān)數(shù)據(jù)。
另一方面,對(duì)于一些不愿意分享自身數(shù)據(jù)的人來說,路人無意識(shí)的行為也可在AI技術(shù)下造成個(gè)人數(shù)據(jù)泄露的可能,比如說在廣場上牌照的人可能會(huì)拍到一些路人的面部數(shù)據(jù),而在人臉識(shí)別技術(shù)下這些路人會(huì)被識(shí)別,數(shù)據(jù)會(huì)被儲(chǔ)存,對(duì)于他們來說,未知意愿下創(chuàng)造的數(shù)據(jù)就決定了其在未來有數(shù)據(jù)泄露的風(fēng)險(xiǎn)。
另外,數(shù)據(jù)本身的價(jià)值也成為數(shù)據(jù)泄露的原因之一,事實(shí)上基于智能手機(jī)的信息采集要比其它方式更加容易,通過智能手機(jī)的后門軟件,可以采集你的手機(jī)號(hào),通訊錄等信息。如果用戶沒有足夠的安全意識(shí),很多軟件安裝都默認(rèn)采集各種信息的,通過智能手機(jī)唯一標(biāo)識(shí)信息很容易做到數(shù)據(jù)的整合與身份信息定位。
由于AI時(shí)代的數(shù)據(jù)資源屬性,大量的用戶數(shù)據(jù)是企業(yè)機(jī)構(gòu)廣告投放優(yōu)化的關(guān)鍵,因而數(shù)據(jù)開放則意味著巨大的商業(yè)價(jià)值,巨頭們?cè)谏鷳B(tài)布局下,通過全鏈?zhǔn)綌?shù)據(jù)通路可獲得精準(zhǔn)、完整的用戶畫像,而巨頭們?cè)跀?shù)據(jù)的商業(yè)化上也更加容易。
對(duì)于AI技術(shù)的提供者而言,數(shù)據(jù)價(jià)值導(dǎo)向下使得數(shù)據(jù)搜集是非常必要的,在初期,人們會(huì)因?yàn)閿?shù)據(jù)被第三方使用而感到不安,從而主張自身的隱私權(quán),實(shí)際上,如果數(shù)據(jù)本身的應(yīng)用并沒有給用戶造成困擾,并且為其帶來便利的服務(wù),那么此時(shí)會(huì)有部分用戶樂于接受分享數(shù)據(jù),因而對(duì)于數(shù)據(jù)價(jià)值的商業(yè)化應(yīng)用上,AI技術(shù)的提供者應(yīng)該持有更謹(jǐn)慎的態(tài)度。
在筆者看來,AI數(shù)據(jù)時(shí)代中,數(shù)據(jù)的商業(yè)化價(jià)值和用戶的隱私權(quán)利之間需要達(dá)到一種動(dòng)態(tài)均衡,即在法律范圍的臨界點(diǎn)內(nèi),數(shù)據(jù)搜集方與用戶之間需要有一種連接機(jī)制,以確保在數(shù)據(jù)產(chǎn)生者的掌控下,有限度的使用數(shù)據(jù)的商業(yè)價(jià)值發(fā)掘,在隱私保護(hù)與AI技術(shù)的便利之間達(dá)成妥協(xié)。而對(duì)于當(dāng)前隱私法、物權(quán)法等相關(guān)法律并沒有對(duì)數(shù)據(jù)歸屬權(quán)益等明確立法的現(xiàn)狀下,有限度的使用數(shù)據(jù)仍然需要依靠企業(yè)的意識(shí)自覺。
數(shù)據(jù)算法偏差下的“AI歧視”
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)有著極底的儲(chǔ)存成本,這也意味著在數(shù)據(jù)驅(qū)動(dòng)的AI時(shí)代,一旦有數(shù)據(jù)生成便很難徹底消除,在數(shù)據(jù)儲(chǔ)存成本的規(guī)模遞減效應(yīng)下,徹底刪除數(shù)據(jù)的成本反而更高,因而,數(shù)據(jù)存在的時(shí)間更長,甚至超過創(chuàng)造數(shù)據(jù)者本身的壽命。而隨著儲(chǔ)存成本的進(jìn)一步降低,在不久的將來個(gè)人數(shù)據(jù)可能會(huì)實(shí)現(xiàn)無限期的儲(chǔ)存。
大數(shù)據(jù)的意義在于不必深究事物“規(guī)律性”的同時(shí)對(duì)于數(shù)據(jù)分析結(jié)論的直接應(yīng)用,因而大數(shù)據(jù)常常被用于結(jié)果預(yù)測,而事實(shí)上,基于數(shù)據(jù)的預(yù)測結(jié)果也具有時(shí)效性,而時(shí)效性失效的結(jié)果則是基于數(shù)據(jù)分析的AI交互失真。
也就是說,如果采集的數(shù)據(jù)本身就具有某種傾向性,則由此訓(xùn)練而來的AI也自然帶有這樣的傾向性。一項(xiàng)來自于美國的調(diào)查研究證明了這一點(diǎn),在一項(xiàng)基于數(shù)據(jù)分析的族群預(yù)測算法中,算法在預(yù)測族群時(shí),通常會(huì)把那些身處有歧視歷史地區(qū)的人預(yù)測為黑人,而事實(shí)上,并非如此。
又如在一則STEM(科學(xué)、技術(shù)、工程、數(shù)學(xué))領(lǐng)域招聘廣告投放中,廣告商發(fā)現(xiàn),則這廣告很少投放給女性,而事實(shí)上廣告商則希望這則廣告是性別中立的。而在“雙曲貼現(xiàn)”效應(yīng)下數(shù)據(jù)的時(shí)效性問題導(dǎo)致數(shù)據(jù)“失準(zhǔn)”,進(jìn)一步引發(fā)“算法歧視”的問題。
雙曲貼現(xiàn)又稱為非理性折現(xiàn),是行為經(jīng)濟(jì)學(xué)的一個(gè)概念,這個(gè)現(xiàn)象描述折現(xiàn)率并不是一個(gè)不變量,具體是指人們?cè)趯?duì)未來的收益評(píng)估其價(jià)值時(shí),傾向于對(duì)較近的時(shí)期采用更低的折現(xiàn)率,對(duì)較遠(yuǎn)的時(shí)期采用更高的折現(xiàn)率。
比如,大多數(shù)人可能傾向于選擇今天收益60元,而不是一年后拿到100元,因?yàn)榻裉爝@60元收入可能更有價(jià)值,而如果讓人們選擇一年后拿到60元或者兩年后拿到100元,則大多數(shù)人會(huì)選擇兩年后拿到100元。即人們會(huì)因?yàn)槭找鏁r(shí)間上的差異從而做出不同的決策。
因而,在雙曲貼現(xiàn)的情況下,人們短期決策行為所產(chǎn)生的數(shù)據(jù)將會(huì)導(dǎo)致數(shù)據(jù)本身失準(zhǔn),從而更加容易導(dǎo)致在數(shù)據(jù)偏差引發(fā)的算法偏差后,在應(yīng)用層面的“算法歧視”。因此,對(duì)于數(shù)據(jù)型AI的使用者而言,在算法的應(yīng)用層面上也需多一份謹(jǐn)慎和細(xì)心。
結(jié)尾:
無論是數(shù)據(jù)AI時(shí)代的個(gè)人隱私問題還是數(shù)據(jù)偏差下的“算法歧視”,都是大數(shù)據(jù)AI發(fā)展之路上不可避免的問題,對(duì)于人們來說,不論是數(shù)據(jù)采集端的隱私侵犯,還是AI應(yīng)用層面的“算法歧視”都是有悖道德甚至法律的邊緣試探。而對(duì)于如今尚處“幼年”中的AI技術(shù)而言,如何正確的引導(dǎo)、影響其發(fā)展,在符合人類價(jià)道德觀念以及道德標(biāo)準(zhǔn)之下創(chuàng)造更大的價(jià)值,則是“AI造物主”們值得深思的問題。
科技自媒體劉志剛,訂閱號(hào):互聯(lián)網(wǎng)江湖,微信號(hào):13124791216,轉(zhuǎn)載保留作者版權(quán)信息,違者必究。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!