文|硅兔賽跑 Lexie
編輯|Lu
過(guò)去幾個(gè)月掀起AI小高潮,先是OpenAI的大模型GPT-4公布,多家測(cè)評(píng)表示比ChatGPT準(zhǔn)確許多,學(xué)習(xí)速度也更快;隨后不久ChatGPT宣布將實(shí)現(xiàn)對(duì)插件的支持,表示它可以通過(guò)第三方服務(wù)為用戶提供更強(qiáng)大的功能。
這些消息讓全網(wǎng)興奮不已,將AI的聰慧捧上神壇之時(shí),AI卻也在悄悄展露自己的另外一個(gè)黑暗面,那就是它撒謊不打草稿的能力。
01 生成式AI:謊言制造機(jī)
我們都知道,AI的強(qiáng)大之處在于能夠快速收集來(lái)自各種源頭的信息并根據(jù)用戶的特殊指令“見(jiàn)機(jī)行事”,這就說(shuō)明即使是非常荒謬和片面的信息也可能被借AI之口說(shuō)出,謠言就這樣因其表述的合理性和完整度被大眾接受和傳播。
新聞評(píng)級(jí)網(wǎng)站Newsguard最近進(jìn)行了一項(xiàng)嘗試,他們讓ChatGPT以反新冠疫苗者的口吻進(jìn)行對(duì)話,結(jié)果AI生成了一段看似非常合理的言論,“有理有據(jù)”的講述疫苗制藥公司如何不擇手段,甚至對(duì)兒童健康產(chǎn)生極大負(fù)面影響他們也不在乎。
這樣的技術(shù)落到造謠者手中,就會(huì)有許多無(wú)知大眾上當(dāng)受騙。
ChatGPT anti vaccine
不僅是文字,AI在圖片和視頻上造假的功力也了得。
川普被捕的一系列假照片在網(wǎng)上被瘋狂轉(zhuǎn)載,這些用AI工具M(jìn)idJourney創(chuàng)造出的圖片十分以假亂真,即使某些細(xì)節(jié)并不合理 - 比如圖中的川普有三條腿,還是不妨礙網(wǎng)友們大肆轉(zhuǎn)發(fā)并信以為真。
而視頻因其復(fù)雜性常常給人難以偽造的假象,殊不知只要在圖片的基礎(chǔ)上稍加技能視頻造假也并沒(méi)那么難。
Deepfake技術(shù)的出現(xiàn)更是讓這件事變得十分簡(jiǎn)單,像是馬斯克為加密貨幣交易平臺(tái)打廣告、拜登和奧巴馬打游戲、假阿湯哥打高爾夫球和變魔術(shù)、還有無(wú)數(shù)女明星被換臉進(jìn)色情片都是deepfake的產(chǎn)物,除了鑒偽專家,普通人實(shí)在難以分辨真假。
deepfake tom cruise
AI作出滑稽的梗圖或許可以博網(wǎng)友一笑,但虛假信息在某些場(chǎng)景下的負(fù)面影響卻是致命的。
2020年“犯罪科學(xué)”的一項(xiàng)報(bào)告顯示,在未來(lái)15年內(nèi)AI可能創(chuàng)造出的安全威脅中,深度偽造被列為最嚴(yán)重的一項(xiàng),而哈里斯民調(diào)機(jī)構(gòu)的調(diào)查也顯示,美國(guó)有67%的成年人對(duì)生成式人工智能技術(shù)的安全性倍感擔(dān)憂,只有約29%的被調(diào)查者表示從未用過(guò)這項(xiàng)技術(shù)也并不打算使用。
02 打假AI:沒(méi)那么簡(jiǎn)單
目前許多AI技術(shù)的開(kāi)發(fā)者都相信這一問(wèn)題需要“以毒攻毒”,科技創(chuàng)造出的麻煩要科技去破局,在這一點(diǎn)上,科技大廠們已經(jīng)在行動(dòng)了:
● Google早在2019年就發(fā)布了一個(gè)大型開(kāi)源數(shù)據(jù)庫(kù),招募演員錄制了視頻后利用網(wǎng)上現(xiàn)有的deepfake技術(shù)進(jìn)行偽造,最終生成的視頻數(shù)據(jù)可以幫助打假技術(shù)的開(kāi)發(fā)者更好學(xué)習(xí)deepfake的算法和邏輯。今年Google還在歐洲地區(qū)開(kāi)始了用付費(fèi)廣告進(jìn)行對(duì)反信謠和鑒別虛假信息的大型宣傳。
Google deep fake database
● 微軟在去年推出了一個(gè)叫做“Video Aunthenticator”的工具,它能夠?qū)Ξ?huà)面中渲染邊界和灰度等級(jí)進(jìn)行逐幀的實(shí)時(shí)分析進(jìn)而生成可靠指數(shù),以此來(lái)幫助用戶鑒別內(nèi)容的真實(shí)性。
Microsoft Video Aunthenticator
●Meta此前也推出過(guò)和Google類似的開(kāi)源數(shù)據(jù)庫(kù),還和微軟及MIT、牛津、UC伯克利等高校聯(lián)合發(fā)起了提供1000萬(wàn)美元獎(jiǎng)金激勵(lì)的挑戰(zhàn)賽,鼓勵(lì)更多檢測(cè)虛假信息和深度偽造技術(shù)的創(chuàng)新。
● Twitter會(huì)對(duì)經(jīng)常發(fā)布deepfake和虛假信息的賬號(hào)進(jìn)行封殺,還會(huì)將比較可疑的內(nèi)容打上標(biāo)簽,并且在用戶轉(zhuǎn)發(fā)這類內(nèi)容時(shí)還會(huì)進(jìn)行“確定要轉(zhuǎn)發(fā)嗎?”的提問(wèn)。
Twitter manipulated media
● TikTok最新推出的社群規(guī)范規(guī)定使用真實(shí)場(chǎng)景進(jìn)行合成的內(nèi)容必須被明確指出, 這就說(shuō)明所有以生成合成式AI創(chuàng)造出的內(nèi)容必須在標(biāo)題或者tag中使用“合成”“虛假”等詞匯。
雖然科技巨頭們?cè)诩夹g(shù)和預(yù)防上都在努力,但虛假和偽造信息似乎并沒(méi)有減少。
打擊虛假和偽造信息難度之大有很多原因,比如首先需要對(duì)什么是虛假信息進(jìn)行一個(gè)準(zhǔn)確的定義,在這點(diǎn)上許多平臺(tái)并做不到,因?yàn)樘摷傩畔⒉⒉皇窃诿總€(gè)場(chǎng)景下都可以被簡(jiǎn)單甄別,而當(dāng)虛假信息被用多種語(yǔ)言傳播到世界各地,難度就更大了。
同時(shí)很多時(shí)候信息本身并不是謊言也不是被偽造出的內(nèi)容,而發(fā)布和傳播者只是巧妙地用了隨意選取的方式來(lái)誤導(dǎo)網(wǎng)民,這類內(nèi)容尤其難跟虛假信息進(jìn)行分別。
再有,對(duì)社交媒體等平臺(tái)來(lái)說(shuō),擊打虛假信息從來(lái)都不是他們商業(yè)目標(biāo)的重中之重,當(dāng)一件事只是為了符合規(guī)范卻并不能帶來(lái)利潤(rùn),顯然微薄的動(dòng)力致使打假的腳步走的異常緩慢。
正因如此,許多人將眼光和希望放在了一批正在將精力全部放在開(kāi)發(fā)鑒別虛假信息技術(shù)的初創(chuàng)公司身上。
03 資本涌向打假初創(chuàng)公司
投資者的資本也伴隨著大眾迫切的希望涌向了這些初創(chuàng)公司,在過(guò)去幾年間,數(shù)億美元被投資進(jìn)了這一賽道。
Disinformation And Misinformation Mitigators
孵化于硅谷加速器Nex Cubed的Blackbird已經(jīng)開(kāi)發(fā)出了一套成熟的鑒偽技術(shù),因在擊破新冠謠言方面表現(xiàn)出色而開(kāi)始被知曉,它的專利算法技術(shù)可以通過(guò)即時(shí)對(duì)上億個(gè)數(shù)據(jù)點(diǎn)的分析搞清楚虛假信息的源頭和傳播者。
這一技術(shù)使用五項(xiàng)「風(fēng)險(xiǎn)信號(hào)」來(lái)對(duì)虛假信息進(jìn)行甄別,包括“敘事口吻”- 對(duì)信息和對(duì)話背景進(jìn)行分析;“社群網(wǎng)絡(luò)”- 對(duì)用戶及分享內(nèi)容之間關(guān)系進(jìn)行分析;“族群”- 對(duì)有類似興趣的用戶是否聚集加劇信息分享的幅度進(jìn)行分析;“操縱”- 對(duì)信息的合理使用進(jìn)行分析;以及“欺騙” - 分析傳統(tǒng)意義上比較明確的真與假。
Blackbird CONSTELLATION DASHBOARD
Blackbird還在今年推出了一個(gè)叫做RAV3N Copilot的AI助手,通過(guò)使用生成式AI來(lái)制作敘事性智能和風(fēng)險(xiǎn)報(bào)告,為虛假信息安全隱患提供更多的背景分析,以此幫助安全部門進(jìn)行更加高效和自動(dòng)化的監(jiān)控和分析。
Blackbird目前融資總額為1000萬(wàn)美元,服務(wù)領(lǐng)域涉及品牌、金融、企業(yè)及公共部門等等,客戶包括美國(guó)國(guó)防部及多個(gè)Fortune 500公司。
背景分析在鑒別虛假信息這件事上十分重要,因?yàn)椴煌瑘?chǎng)景的信息使用可能會(huì)導(dǎo)致真或偽的天壤之別,因其人工智能和自然語(yǔ)言處理(NLP)防偽技術(shù)而知名的舊金山公司Primer最近就對(duì)背景智能技術(shù)公司Yonder進(jìn)行了收購(gòu)。
Primer的神經(jīng)網(wǎng)絡(luò)技術(shù)可以快速對(duì)大量文本進(jìn)行掃描,根據(jù)詞語(yǔ)的頻率和重點(diǎn)提取主題,快速識(shí)別可疑信息,這樣以來(lái)可以對(duì)全球事件進(jìn)行即時(shí)分析,識(shí)別用虛假信息進(jìn)行的大型宣傳,對(duì)網(wǎng)絡(luò)安全攻擊事件進(jìn)行反擊等等。它的NLP模型結(jié)合上Yonder的背景敘事智能分析能力,讓用戶甚至能夠預(yù)防性的監(jiān)控即將出現(xiàn)的虛假信息,快速識(shí)別謠言背后的造謠者,分析潛在風(fēng)險(xiǎn)等級(jí),以及對(duì)受到虛假信息傷害的品牌和行動(dòng)用系統(tǒng)提供的建議減小損傷程度。Primer如今已經(jīng)完成了1.68億美元融資,最大投資包括來(lái)自Lux Capital的4000萬(wàn)美元B輪和來(lái)自Addition的1.1億美元C輪。
在紐約和特拉維夫都有團(tuán)隊(duì)的ActiveFence也是獲得了這一賽道最多融資的公司之一,融資總額達(dá)到了1億美元,包括來(lái)自Grove Ventures和Norwest Venture Partners的A輪,以及CRV和Highland Europe的B輪。
ActiveFence的技術(shù)使用NLP對(duì)全網(wǎng)正在進(jìn)行的對(duì)話進(jìn)行搜索,即使是網(wǎng)絡(luò)最深處的角落也可以觸及,然后通過(guò)對(duì)“壞種子”式信息的預(yù)判進(jìn)行風(fēng)險(xiǎn)分析,這就意味著它可以預(yù)估一段看似無(wú)害的對(duì)話是否會(huì)被造謠者惡意使用,導(dǎo)致更加深遠(yuǎn)的惡性影響,這種前瞻性對(duì)于虛假信息的預(yù)防來(lái)說(shuō)格外關(guān)鍵,ActiveFence的主要客戶包括社交媒體、音頻及視頻流媒體、文件分享平臺(tái)和游戲平臺(tái)等,覆蓋用戶總數(shù)達(dá)到了10億+。
DeepMedia可以說(shuō)是一家提供“雙管齊下”業(yè)務(wù)的公司,最初的主營(yíng)生意是開(kāi)發(fā)出了可以通過(guò)翻譯、語(yǔ)音合成和配音等技術(shù)讓用戶看起來(lái)能說(shuō)多種語(yǔ)言的工具DubSync,而在這項(xiàng)服務(wù)成功被接受后目前研究起了如何監(jiān)測(cè)合成音頻和視頻的技術(shù),它對(duì)其監(jiān)測(cè)工具的訓(xùn)練方式就是通過(guò)用自家的合成工具不斷生成deepfake,然后考驗(yàn)監(jiān)測(cè)系統(tǒng)是否能夠察覺(jué)。
創(chuàng)始人Gupta表示現(xiàn)有的像是DeeperForensics和FaceForensics等大型數(shù)據(jù)庫(kù)在合成時(shí)往往帶有強(qiáng)烈的偏見(jiàn),因此訓(xùn)練出的技術(shù)在監(jiān)測(cè)上也有盲點(diǎn),而DeepMedia的競(jìng)爭(zhēng)優(yōu)勢(shì)在于它所使用的deepfake數(shù)據(jù)庫(kù)質(zhì)量更高,對(duì)于網(wǎng)絡(luò)上現(xiàn)有的deepfake內(nèi)容的代表性也更強(qiáng)。
這一AI監(jiān)測(cè)工具在預(yù)先處理和正式分析方面都十分強(qiáng)大,比如它要想驗(yàn)證一個(gè)視頻中的阿湯哥是否是真的,首先模型需要對(duì)視頻中人物的臉部特征進(jìn)行提取并分析,然后從背景音中提取出人物的真聲,接下來(lái)這些信息會(huì)在一系列的分類器中被檢驗(yàn), 最后整體的內(nèi)容還要被卷積神經(jīng)網(wǎng)絡(luò)刷一遍看看生成deepfake的算法是否被使用。
DeepMedia detection
DeepMedia還開(kāi)始了使用基于視覺(jué)的圖像分類模型,Google就是用這種模型來(lái)進(jìn)行搜索結(jié)果提取的,這樣的模型比傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練速度要快上10倍。DeepMedia的這一監(jiān)測(cè)業(yè)務(wù)已經(jīng)和美國(guó)空軍下屬的實(shí)驗(yàn)室達(dá)成了合作,目前準(zhǔn)確率達(dá)到了95%,會(huì)在99%的時(shí)候在市面上公開(kāi)發(fā)布。
大廠也好,初創(chuàng)公司也好,他們?yōu)榇蚣倏萍佳邪l(fā)所作出的努力至關(guān)重要。
在未來(lái)的5到10年內(nèi),AI技術(shù)的發(fā)展將更快,這也就意味著AI在“撒謊”這件事上會(huì)更加聰明,僅靠網(wǎng)友們的人工鑒別肯定是不夠的。
許多deepfake賽道的創(chuàng)始人呼吁各國(guó)政府的參與也至關(guān)重要,比如設(shè)立跨國(guó)界的對(duì)于虛假信息界定和干預(yù)的規(guī)范條例,比如撥款用于這一類危機(jī)的教育和研究等等。
如果AI有善和惡之分的話,那么未來(lái)幾年在虛假信息這方面可以說(shuō)是AI自身善與惡的一場(chǎng)賽跑,雖然科技不是唯一的答案,但希望我們眾志成城的打假行動(dòng)能夠?yàn)槲覀儬?zhēng)取一些時(shí)間。
參考來(lái)源:
AI is eating itself: Bing’s AI quotes COVID disinfo sourced from ChatGPT (Techcrunch)
Meet the AI-powered startup catching fake news(Wired)
It’s No Lie: Startups Fighting Disinformation Are Raking In Cash(Crunchbase News)
Meet the company working with the Air Force to detect deepfakes(DeepMedia)