UCL研究| 深偽技術(shù)下,超1/4中英文語(yǔ)音能以假亂真
指南者留學(xué) 2024-09-11 17:14:26 閱讀量:1020
<p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"><span style="font-size: 15px; color: #4a4949; visibility: visible;">這項(xiàng)研究于9月10日在</span><span style="font-size: 15px; color: #ab1942; visibility: visible;">《公共科學(xué)圖書(shū)館&middot;綜合》(PLOS ONE)</span><span style="font-size: 15px; color: #4a4949; visibility: visible;">上發(fā)表,是有史以來(lái)</span><span style="font-size: 15px; color: #ab1942; visibility: visible;">第一項(xiàng)</span><span style="font-size: 15px; color: #4a4949; visibility: visible;">評(píng)估人類(lèi)在除英語(yǔ)之外的其他語(yǔ)言中識(shí)別人工生成語(yǔ)音能力的研究。</span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"><span style="font-size: 15px; color: #4a4949; visibility: visible;">深偽技術(shù)(Deepfakes)是用于生成模仿真實(shí)人聲或外貌的合成媒體技術(shù),屬于生成式人工智能(generative artificial intelligence)的范疇。在這種機(jī)器學(xué)習(xí)(machine learning, ML)過(guò)程中,算法能學(xué)習(xí)數(shù)據(jù)集(如真人視頻或音頻)的模式和特征,從而復(fù)刻原始圖像或聲音。 </span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"><span style="font-size: 15px; color: #4a4949; visibility: visible;">早期的深偽語(yǔ)音算法需要成千上萬(wàn)個(gè)人聲樣本才能生成一段原創(chuàng)音頻,但最新的預(yù)訓(xùn)練算法只需一個(gè)人說(shuō)<span style="font-size: 15px; color: #ab1942; visibility: visible;">三秒鐘</span>就能復(fù)刻其聲音。即使不具備專(zhuān)業(yè)知識(shí),一個(gè)普通人在<span style="font-size: 15px; color: #ab1942; visibility: visible;">短短幾天內(nèi)</span>就可以掌握這項(xiàng)技術(shù),并且這些開(kāi)源算法還是免費(fèi)的。<span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; visibility: visible;">蘋(píng)果最近發(fā)布了一款軟件,使用者用</span><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942; visibility: visible;">5分鐘</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; visibility: visible;">的錄音就能在iPhone和iPad上創(chuàng)建自己的聲音副本。</span> </span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;"><span style="font-size: 15px; color: #4a4949; visibility: visible;"><img style="display: block; margin-left: auto; margin-right: auto;" src="https://info.compassedu.hk/sucai/content/1728292329072/1728292329072.jpg" width="763" height="477" /></span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em; visibility: visible;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; font-size: 15px; color: #4a4949;">UCL研究人員使用的是一種</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; font-size: 15px; color: #ab1942;">語(yǔ)音合成(text-to-speech, TTS)算法</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; font-size: 15px; color: #4a4949;">?;谝粋€(gè)英語(yǔ)和一個(gè)普通話的公開(kāi)可用數(shù)據(jù)庫(kù),他們?yōu)閮煞N語(yǔ)言各生成了50個(gè)深度偽造語(yǔ)音樣本。&nbsp;</span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;">接著,研究人員邀請(qǐng)</span><span style="font-size: 15px; color: #ab1942;">529人</span><span style="font-size: 15px; color: #4a4949;">參與試驗(yàn)將人工生成的音頻樣本和真實(shí)音頻樣本區(qū)分開(kāi)來(lái)。<strong>結(jié)果顯示只有73%的時(shí)間里,人們能識(shí)別出人工生成的語(yǔ)音。</strong>參與試驗(yàn)人員接受了</span><span style="font-size: 15px; color: #ab1942;">識(shí)別深偽語(yǔ)音的培訓(xùn)</span><span style="font-size: 15px; color: #4a4949;">之后再次嘗試,這一比例也只略微提高。&nbsp;</span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #ab1942;">UCL計(jì)算機(jī)科學(xué)學(xué)院的Kimberly Mai</span><span style="font-size: 15px; color: #4a4949;">作為論文的</span><span style="font-size: 15px; color: #ab1942;">第一作者</span><span style="font-size: 15px; color: #4a4949;">,說(shuō)道:&ldquo;我們的研究證實(shí)了人類(lèi)無(wú)法有效分辨深偽技術(shù)制作的語(yǔ)音。針對(duì)性訓(xùn)練的作用也微乎其微。不過(guò)需要指出來(lái)的是,我們的語(yǔ)音樣本是用比較老的算法做的。如果是用目前最尖端的或者未來(lái)的技術(shù),結(jié)果如何還不得而知。&rdquo;&nbsp;</span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;">研究團(tuán)隊(duì)的下一個(gè)目標(biāo)是開(kāi)發(fā)更準(zhǔn)確的</span><span style="font-size: 15px; color: #ab1942;">自動(dòng)語(yǔ)音檢測(cè)器</span><span style="font-size: 15px; color: #4a4949;">,提升對(duì)人工合成的音頻和圖像的檢測(cè)能力,以更好地應(yīng)對(duì)它們帶來(lái)的各類(lèi)負(fù)面影響。&nbsp;</span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;">盡管生成式人工智能音頻技術(shù)有很多好處,例如幫助那些表達(dá)能力受限或因疾病失去聲音的人,但人們?cè)絹?lái)越擔(dān)心這種技術(shù)可能會(huì)被犯罪分子利用,危害他人和社會(huì)。&nbsp; </span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;">比如在2019 年,某家英國(guó)能源公司的首席執(zhí)行官被偽造成其上司聲音的深偽語(yǔ)音所騙,將數(shù)十萬(wàn)英鎊轉(zhuǎn)賬給了一家冒名的供應(yīng)商。 </span></p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;">&nbsp;</p> <p style="margin-left: 8px; margin-right: 8px; line-height: 1.75em;"><span style="font-size: 15px; color: #4a4949;"><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942;">UCL計(jì)算機(jī)科學(xué)學(xué)院 Lewis Griffin教授</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif;">是該研究的</span><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942;">負(fù)責(zé)人(senior author)</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif;">。他說(shuō):&ldquo;生成式人工智能技術(shù)越來(lái)越成熟,許多工具也應(yīng)運(yùn)而生,這種情況下機(jī)會(huì)和風(fēng)險(xiǎn)將并存。政府機(jī)構(gòu)制定戰(zhàn)略來(lái)</span><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942;">防止濫用這些工具</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif;">是明智之舉,但我們也應(yīng)該</span><span style="font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif; color: #ab1942;">看到這個(gè)領(lǐng)域的光明前景</span><span style="color: #4a4949; font-size: 15px; font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Hiragino Sans GB', 'Microsoft YaHei UI', 'Microsoft YaHei', Arial, sans-serif;">。&rdquo;&nbsp;</span> </span></p>
預(yù)約咨詢
預(yù)約咨詢
猜你喜歡
微信咨詢
掃一掃立即咨詢
App下載
下載指南者留學(xué)App
在線客服
電話咨詢
400-183-1832
回到頂部
預(yù)約咨詢
現(xiàn)在來(lái)設(shè)置你的賬號(hào)吧
只需要花不到一分鐘,之后便可以獲得更精準(zhǔn)的推薦~
1
留學(xué)意向
2
基本意向
3
詳細(xì)背景
4
了解途徑
1.1 您期望申請(qǐng)學(xué)歷是
1.2 您期待的留學(xué)地區(qū)是多選
2.1 您的身份狀態(tài)是
2.2 您的目前學(xué)歷是
3.1 您的本科學(xué)校是
大陸本科
海外本科
3.2 您的學(xué)校名稱(chēng)是
沒(méi)有查詢到相關(guān)的學(xué)校
查詢中...
3.3 您的專(zhuān)業(yè)名稱(chēng)是
沒(méi)有查詢到相關(guān)的專(zhuān)業(yè)
查詢中...
4. 您了解到我們的途徑是
取消