2014 年的一個(gè)清晨,瓦爾·基爾默醒來(lái),發(fā)現(xiàn)自己置身血泊之中。全身上下唯一的異樣是喉嚨,里面出現(xiàn)了一個(gè)腫塊,讓他吞咽困難。
(資料圖)
他很快得到診斷,是喉癌導(dǎo)致的嘔血。為了治療,他不得不接受氣管切開(kāi)術(shù)。手術(shù)在喉嚨上留下一個(gè)洞,進(jìn)食時(shí)需要接入一根管子。此后,“呼吸還是吃飯?”,變成了一個(gè)二選一的問(wèn)題。
瓦爾·基爾默在《壯志凌云》中與阿湯哥的對(duì)手戲 | 來(lái)源:Looper
對(duì)于這位曾扮演 95 版蝙蝠俠的好萊塢演員,更嚴(yán)重的后果是,他失去了自己的聲音。如今,當(dāng)他嘗試說(shuō)話,只能發(fā)出介于“吱吱聲和低吼”之間的聲音。
去年,基爾默決定與人工智能公司 Sonantic 合作,恢復(fù)自己“說(shuō)話的能力”。憑借有限的錄音,他們成功克隆出了跟生病前的基爾默十分相像的聲音,未來(lái)將可以替代他進(jìn)行發(fā)言。
AI 合成人聲的技術(shù)已經(jīng)十分成熟。一些開(kāi)放免費(fèi)測(cè)試的主流平臺(tái),例如 Resemble AI、Descript ,僅需要你錄入 25 句話或 10 分鐘錄音,就能克隆你的聲音——當(dāng)然,訓(xùn)練集的時(shí)長(zhǎng)越長(zhǎng),模型就會(huì)與你越相像。最低要求呢?3.7 秒就可以。
除了服務(wù)基爾默這樣的病人,語(yǔ)音克隆還有一大用處,是“復(fù)活故人”,不論是去世的親人,還是已故的名人。不久前,語(yǔ)音合成公司 Play.ht 釋出了一集播客,內(nèi)容是喬布斯與著名播客主播喬·羅根對(duì)談——其中的文本和人聲全都是 AI 合成的。
“冒牌貨”們?cè)诓タ屠镎勑︼L(fēng)生,從頭至尾本尊都不用參與其中。這是否會(huì)涉及到侵權(quán)呢?尤其是已過(guò)世者,他們的聲音所有權(quán)歸屬于誰(shuí)呢?任何人都可以使用么?
更棘手的問(wèn)題是,真假如何分辨呢?
挺好的技術(shù),卻被用來(lái)行騙?
別說(shuō)你一定分得出人聲與 AI。
2019 年 3 月,英國(guó)一家能源公司的員工接到老板電話,要求他在一個(gè)小時(shí)內(nèi)轉(zhuǎn) 22 萬(wàn)歐元給匈牙利的一家供應(yīng)商,電話那頭“老板”略帶德國(guó)口音,和平時(shí)老板說(shuō)話的聲音不差分毫,他毫不懷疑立刻照辦了,轉(zhuǎn)賬后這筆錢(qián)很快被轉(zhuǎn)移到墨西哥,難再追回;2020 年,香港的一名銀行經(jīng)理被克隆語(yǔ)音欺騙,向詐騙者批準(zhǔn)了一筆 3500 萬(wàn)美金的轉(zhuǎn)賬。
這種事情正在變得越來(lái)越多, VMware 今年的調(diào)查顯示,三分之二的受訪企業(yè)表示過(guò)去一年收到的詐騙攻擊中存在音頻或視頻偽造的成分。
當(dāng)你在電話里聽(tīng)到一個(gè)熟悉的聲音,大多數(shù)人“沒(méi)有建立起肌肉記憶來(lái)真正應(yīng)對(duì)它?!卑I馨踩径驴偨?jīng)理麗莎?奧康納表示。
生理結(jié)構(gòu)上,人類(lèi)大腦面對(duì)假聲音時(shí)會(huì)變得蠢蠢的。
2019 年加州大學(xué)河濱分校的一項(xiàng)研究發(fā)現(xiàn),在觀看倫勃朗畫(huà)作的真跡和贗品時(shí),人們的腦部掃描會(huì)顯現(xiàn)出明顯的差異;聆聽(tīng)摩根 · 弗里曼、機(jī)器弗里曼和模仿者說(shuō)話時(shí),卻沒(méi)有同樣表現(xiàn)。
“結(jié)果表明,人類(lèi)可能在本質(zhì)上無(wú)法區(qū)分真實(shí)的和非真實(shí)的聲音?!?/p>
聆聽(tīng)真人和合成人聲時(shí),人腦活動(dòng)沒(méi)有顯現(xiàn)出顯著差異 | 來(lái)源:論文配圖
AI 偽造人聲無(wú)敵了么?
科學(xué)家正在試圖應(yīng)對(duì)它。
最近的一項(xiàng)研究中,佛羅里達(dá)大學(xué)的研究者們發(fā)現(xiàn)了機(jī)器的一個(gè)破綻:沒(méi)有聲道?;蛘哒f(shuō),人類(lèi)發(fā)聲方式的局限,在于每一個(gè)人的聲道結(jié)構(gòu),而 AI 不具備這樣的“局限性”。
數(shù)十年來(lái),科學(xué)家都試圖重現(xiàn)史前生物的聲音。猛犸象、恐龍……它們的嘯叫、呼喊,聽(tīng)起來(lái)會(huì)是怎樣的?骨骼的形狀提供了許多線索,比如副櫛龍,它們的頭骨中有一個(gè)很長(zhǎng)的腔,科學(xué)家據(jù)此來(lái)估測(cè)它的共振頻率。
人類(lèi)發(fā)聲也是如此,通過(guò)使用聲道的各種結(jié)構(gòu),聲帶、舌頭、嘴唇,協(xié)作擠壓空氣來(lái)發(fā)出聲音并改變聲音。使用聲學(xué)和流體動(dòng)力學(xué)模型,研究者可以倒推出怎樣的一個(gè)結(jié)構(gòu)發(fā)出了這段聲音。
通常會(huì)像是這樣,一個(gè)不規(guī)則的,有突起和凹陷的通路。
口腔的打開(kāi)程度會(huì)決定我們發(fā)出怎樣的聲音|來(lái)源:論文截圖
然而,當(dāng)他們把機(jī)器生成的聲音放入同樣模型時(shí),奇怪的事情就發(fā)生了:
紅圈中為機(jī)器的“聲道結(jié)構(gòu)” |來(lái)源:論文截圖
機(jī)器人聲倒推出來(lái)聲道,就像一根又細(xì)又長(zhǎng)的吸管,這跟人體的正常結(jié)構(gòu)完全不同。僅憑這樣的側(cè)面解剖圖,就幾乎可以立刻分辨這是人發(fā)出的聲音,還是機(jī)器的。通過(guò)這個(gè)方法,他們檢驗(yàn)了 4966 個(gè)音頻語(yǔ)段,準(zhǔn)確率高達(dá) 99.9%。
想象一下,這或許很快會(huì)成為一個(gè)基礎(chǔ)配置,當(dāng)你接起一通電話,一個(gè)附加的插件會(huì)同時(shí)開(kāi)始運(yùn)轉(zhuǎn),判斷對(duì)面是真人還是機(jī)器合成人聲,再向你發(fā)出警告。
已經(jīng)有很多人在為此努力。2019 年,為了對(duì)抗克隆語(yǔ)音、假音頻,Google 發(fā)布了一個(gè)合成語(yǔ)音數(shù)據(jù)庫(kù),來(lái)推動(dòng)對(duì)假音頻檢測(cè)的研究,里面包含了谷歌深度學(xué)習(xí)模型所“說(shuō)”的上千個(gè)短語(yǔ),用 68 種不同的聲音覆蓋了各式各樣的口音,希望以此鼓勵(lì)外界開(kāi)發(fā)出更多語(yǔ)音鑒真的方案。
沒(méi)有科學(xué)家的工具,我們自己怎么辦?
有一些小竅門(mén),但主要靠直覺(jué)。
語(yǔ)音認(rèn)證服務(wù)公司 Pindrop 一直在開(kāi)發(fā)合成聲音,這個(gè)過(guò)程中他們也發(fā)現(xiàn)了機(jī)器的一些缺陷:
不善于處理摩擦音,比如 f,s,v,z ,因?yàn)檐浖茈y將它們與噪音區(qū)分開(kāi)來(lái)
愛(ài)拖長(zhǎng)音,算法很難區(qū)分單詞的末尾和錄音中的背景噪音,會(huì)出現(xiàn)斷句的問(wèn)題
過(guò)于“干凈”,像是在錄音室里用專(zhuān)業(yè)設(shè)備錄制的,且質(zhì)量始終如一
Pindrop 也發(fā)現(xiàn)了一些異?!奥斆鳌钡姆缸锓肿樱瑸榱搜谏w這些缺陷,故意放入嘈雜的環(huán)境音來(lái)干擾對(duì)方的判斷。有一位他們稱之為“雞人”的詐騙犯,總是在背景中播放公雞的叫聲;還有一位女士會(huì)利用嬰兒的啼哭聲做背景音,試圖來(lái)博取對(duì)方的同情。
因此,當(dāng)發(fā)現(xiàn)對(duì)面有持續(xù)奇怪的噪聲,你就要小心了。
對(duì)于涉及重大交易的對(duì)話,深度偽造偵測(cè)公司 Deeptrace 的主管亨利?阿杰德給出了一個(gè)實(shí)用建議:考慮使用暗號(hào)進(jìn)行對(duì)話,或者在通話開(kāi)始時(shí)提出或回答一個(gè)秘密問(wèn)題。
以當(dāng)前 AI 的學(xué)習(xí)速度,相信很快,這些拙劣的破綻就會(huì)被逐一擊破——曾有一篇論文研究發(fā)現(xiàn),通過(guò)人物眨眼的不規(guī)律,可以判斷視頻是否為深度偽造。可僅僅幾個(gè)月之后,開(kāi)發(fā)者就解決了這個(gè) bug 。
但至少現(xiàn)在,人類(lèi)仍能通過(guò)細(xì)枝末節(jié)的線索,判斷出對(duì)方非我同類(lèi)。比如,在羅根與喬布斯的對(duì)談中,總有詭異的笑聲穿插在流利的對(duì)話中,“呵呵呵、嘻嘻嘻”,十分突兀,語(yǔ)調(diào)也會(huì)因此變形。
這讓人想起 Resemble 在語(yǔ)音生成后,會(huì)給你一些選項(xiàng),可以在段落中加入停頓或是“憤怒”、“喜悅”這樣的情緒。從反饋來(lái)看,模型似乎并尚不能很好地處理情緒。
但終有一天,我們要懷疑一切。
前幾天同事小楊接到一個(gè)推銷(xiāo)電話,開(kāi)了免提,熱火朝天地跟辦公室里其他人討論對(duì)方是不是機(jī)器人。
突然,電話對(duì)面緩緩傳來(lái):“對(duì)不起,我說(shuō)話的方式讓您誤解了?!?/p>
“你信這是真人了么?”
他回答:“哼,我才不信,這肯定是 AI 的伎倆?!?/p>
參考文獻(xiàn)
[1] https://www.ndss-symposium.org/wp-content/uploads/2019/02/ndss2019_08-3_Neupane_paper.pdf
[2] https://theconversation.com/deepfake-audio-has-a-tell-researchers-use-fluid-dynamics-to-spot-artificial-imposter-voices-189104
[3] https://www.nytimes.com/2020/05/06/magazine/val-kilmer.html
[4] https://www.yahoo.com/entertainment/val-kilmer-cancer-treatment-lost-voice-142401511.html
[5] https://www.hellomagazine.com/healthandbeauty/health-and-fitness/20210825120419/val-kilmer-heartbreaking-reveal-cancer-diagnosis/[6] https://arstechnica.com/information-technology/2022/10/fake-joe-rogan-interviews-fake-steve-jobs-in-an-ai-powered-podcast/
[7] https://www.howtogeek.com/682865/audio-deepfakes-can-anyone-tell-if-they-are-fake/
[8] https://senseient.com/wp-content/uploads/Deepfakes-updated.pdf
[9] https://mitsloan.mit.edu/ideas-made-to-matter/deepfakes-explained
作者:翁垟
果殼(ID:Guokr42)
如需轉(zhuǎn)載,請(qǐng)聯(lián)系sns@guokr.com
歡迎轉(zhuǎn)發(fā)到朋友圈
來(lái)源:果殼
標(biāo)簽: 從頭至尾 加州大學(xué)河濱分校 談笑風(fēng)生
凡本網(wǎng)注明“XXX(非現(xiàn)代青年網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。
原標(biāo)題:《卿卿日?!防?,九川禮儀為何各不同?這部戲的禮儀從最開(kāi)始的時(shí)候,最吸引觀眾的就是九川禮儀各不相同了。從第一集開(kāi)始,我們就看到
2022-12-15 05:44
原標(biāo)題:此“郁金香”非彼“郁金香”唐代的外來(lái)香料真“香”文 北京青年報(bào)記者陳品中國(guó)香文化歷史悠久,早在石器時(shí)代就有焚香祭祀的行為,先祖
2022-12-14 13:42
原標(biāo)題:《故鄉(xiāng)潮州》出版專(zhuān)訪陳平原教授(引題)談?wù)摴枢l(xiāng),是一門(mén)學(xué)問(wèn),也是一種心境(主題)文 北京青年報(bào)記者王勉而心境好解,這學(xué)問(wèn)又是如
2022-12-13 20:33
原標(biāo)題:《逐光的孩子》高校“開(kāi)講”工人日?qǐng)?bào)—中工網(wǎng)記者鄒明強(qiáng)通訊員卓張鵬胡蘭楊倩文攝影彭佳12月11日,中南財(cái)經(jīng)政法大學(xué)藝術(shù)大思政課《逐
2022-12-13 17:34
原標(biāo)題:打磨六七年小說(shuō)《天圣令》講了什么故事?中新網(wǎng)12月12日電近日,兩場(chǎng)主題為“從‘天圣令’看宋韻文化”的講座舉行,著名作家蔣勝男從
2022-12-13 13:50
原標(biāo)題:《人在草木間》系列融媒體報(bào)道今起推出北京時(shí)間11月29日晚,“中國(guó)傳統(tǒng)制茶技藝及其相關(guān)習(xí)俗”,列入聯(lián)合國(guó)教科文組織人類(lèi)非物質(zhì)文化
2022-12-12 21:39
原標(biāo)題:山西明日起多個(gè)文化場(chǎng)館恢復(fù)開(kāi)放記者日前了解到,山西博物院、山西青銅博物館、太原市博物館、臨汾市博物館以及太原市圖書(shū)館等文化場(chǎng)
2022-12-12 20:36
原標(biāo)題:《三體》上線首日播量放過(guò)億工人日?qǐng)?bào)—中工網(wǎng)記者張翀12月10日,《三體》動(dòng)畫(huà)在嗶哩嗶哩(以下簡(jiǎn)稱“B站”)全網(wǎng)獨(dú)家上線,首周兩集連
2022-12-12 19:33
原標(biāo)題:郭沫若屈原研究的時(shí)代氣象晚清七十年,中西文化在激烈碰撞中相互借鑒、吸收和融合。在這一時(shí)代大背景之下,20世紀(jì)上半葉的楚辭研究在
2022-12-12 14:45
原標(biāo)題:中國(guó)近代日記研究的拓展、反思與未來(lái)(主題)——從“日記研究叢書(shū)”說(shuō)起(副題)日記這種文獻(xiàn)類(lèi)型和書(shū)寫(xiě)方式,在中國(guó)具有悠久的傳統(tǒng)
2022-12-12 14:43
原標(biāo)題:《詩(shī)經(jīng)》的禮義、樂(lè)義、詩(shī)義與經(jīng)義《詩(shī)經(jīng)》所載樂(lè)歌,本為兩周禮儀的用樂(lè)與歌舞的歌詞,要對(duì)其詩(shī)義進(jìn)行清晰的解讀,需要回到歷史現(xiàn)場(chǎng)
2022-12-12 11:32
原標(biāo)題:微短劇靠什么贏得觀眾喜歡最近一段時(shí)間,單集不超過(guò)10分鐘的微短劇深受觀眾喜愛(ài)。數(shù)據(jù)顯示,今年僅快手平臺(tái)的微短劇日活躍用戶便增長(zhǎng)
2022-12-12 08:32
原標(biāo)題:考古還原青藏高原絲路的樣貌仝濤【考古中國(guó)】??●青海都蘭熱水一號(hào)大墓出土大量來(lái)自唐朝、中亞和西亞的絲織品、金銀器,以及各類(lèi)寶石
2022-12-12 08:52
圖片故事原標(biāo)題:劍川木雕:傳承千年技藝段四興在進(jìn)行木雕制作中的打坯流程(12月1日攝)。劍川木雕是云南省劍川縣傳統(tǒng)美術(shù)項(xiàng)目,歷史悠久,具
2022-12-12 08:37
原標(biāo)題:劇場(chǎng)藝術(shù)如何拓展邊界找尋多樣表達(dá)北京晚報(bào)記者高倩12月8日至9日,“2022世界劇院北京論壇”和“2022臺(tái)湖舞美國(guó)際論壇”在國(guó)家大劇院
2022-12-12 05:40
原標(biāo)題:想學(xué)藝、想掙錢(qián)?快來(lái)村里這塊“寶地”集合!據(jù)12月8日甘肅省文旅廳、人社廳、鄉(xiāng)村振興局聯(lián)合印發(fā)的通知,甘肅新認(rèn)定28家省級(jí)非遺工坊
2022-12-11 21:55
原標(biāo)題:西安多家博物館明天起陸續(xù)開(kāi)放陜西西安多家博物館11日發(fā)布公告,明天(12日)起陸續(xù)恢復(fù)開(kāi)放。西安博物院12月12日(星期一)起恢復(fù)對(duì)
2022-12-11 21:36
原標(biāo)題:世界杯的魅力韓立群1990年世界杯我17歲,我家黑白電視14寸。記得馬拉多納無(wú)能為力的淚水。1994年巴喬橫空出世,一路帶著意大利打入決
2022-12-11 20:42
原標(biāo)題:初冬張燕峰初冬。田野空曠,露出黑油油的泥土,像一位剛剛生產(chǎn)過(guò)的母親,袒露著的胸膛,平靜而疲憊??拷坪跄苈?tīng)到來(lái)自大地深處
2022-12-11 11:36
原標(biāo)題:別了,青石板的巷陌田海明夏雨猛烈而迅疾,砸在屋檐上,迸濺出水花,瀉出朦朧的水簾,隔絕了我望向窗外的視線。爸從外邊回來(lái),穿著的
2022-12-11 11:44
原標(biāo)題:一把檀木梳鄧素芳《牡丹花瓶》 文森特·凡高[荷] 瑪咖供圖月光從門(mén)外涌進(jìn)來(lái),閃著銀色的粼光。我坐在梳妝臺(tái)前,檀木梳隱發(fā)著淡淡的
2022-12-11 11:32
【藝評(píng)】原標(biāo)題:最好的書(shū)店氛圍,是看得見(jiàn)的對(duì)閱讀的愛(ài)羅筱曉最近,位于杭州解放路的新華書(shū)店因內(nèi)部改造暫時(shí)閉店。這家書(shū)店建成于1954年,是
2022-12-11 05:44
原標(biāo)題:從“中文熱”到“天宮熱”(主題)——中文教學(xué)助推中國(guó)和阿拉伯國(guó)家文化交流(副題)藺妍林建杰“這是中國(guó),這是阿聯(lián)酋,我們是好朋
2022-12-11 05:32
【視線】原標(biāo)題:電視劇、小說(shuō)同時(shí)推出(引題)《大博弈》書(shū)寫(xiě)時(shí)代浪潮下的中國(guó)工業(yè)制造(主題)中工網(wǎng)訊(工人日?qǐng)?bào)—中工網(wǎng)記者蘇墨)近日,
2022-12-11 05:34
原標(biāo)題:“凌家灘文化展”在安徽博物院開(kāi)展12月7日,觀眾參觀“凌家灘文化展”。12月7日起,“璀璨星光——凌家灘文化展”在安徽博物院開(kāi)展。
2022-12-11 05:36