資料圖片
將電視機(jī)調(diào)成“靜音”模式后,人工軟件你能“看懂”主持人說(shuō)的智能專話嗎?在這個(gè)情景之內(nèi),你或許感覺(jué)這是唇語(yǔ)唇語(yǔ)北京朝陽(yáng)美女上門(mén)聯(lián)系方式vx《134-8006-5952》提供外圍女上門(mén)服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)一個(gè)游戲,但“唇讀”已伴隨人工智能越來(lái)越精準(zhǔn)。解讀
據(jù)BBC報(bào)道,對(duì)電谷歌最近與英國(guó)牛津大學(xué)合作開(kāi)發(fā)了一套唇讀軟件,視嘉通過(guò)收看數(shù)千小時(shí)BBC的賓準(zhǔn)倍電視節(jié)目來(lái)開(kāi)啟唇讀功能。令人震驚的確率是,該軟件不僅掌握了唇語(yǔ),人工軟件還比唇讀專家做得好。智能專
此前,唇語(yǔ)唇語(yǔ)英國(guó)皇家檢察院雇傭“讀唇女王”杰西卡·里斯為英國(guó)唯一的解讀官方唇讀證人,根據(jù)英國(guó)警方用監(jiān)控?cái)z像機(jī)偷拍下來(lái)的對(duì)電北京朝陽(yáng)美女上門(mén)聯(lián)系方式vx《134-8006-5952》提供外圍女上門(mén)服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)嫌犯錄像,用唇讀翻譯出錄像帶中嫌犯的視嘉對(duì)話,提供至關(guān)緊要的賓準(zhǔn)倍證據(jù)。她熟練高超的唇讀技術(shù),讓人很難發(fā)現(xiàn)她是一名耳聾者。
值得一提的是,谷歌的人工智能唇讀軟件,學(xué)習(xí)了BBC一系列的電視節(jié)目,所有視頻資料加起來(lái)約有11.8 萬(wàn)句話,經(jīng)過(guò)了約5000小時(shí)的訓(xùn)練,便迅速掌握了唇讀技能。研究人員用人工智能軟件對(duì)電視節(jié)目嘉賓進(jìn)行唇語(yǔ)解讀,準(zhǔn)確率為46.8%,而專業(yè)的唇語(yǔ)專家在接受同樣的測(cè)試時(shí),準(zhǔn)確率僅為12.4%。
無(wú)獨(dú)有偶,牛津大學(xué)的另一獨(dú)立小組也于不久前開(kāi)發(fā)了一款類似的人工智能唇讀軟件,在測(cè)試中達(dá)到了93.4%的準(zhǔn)確率,而人類的準(zhǔn)確率僅為52.3%。但該測(cè)試所用的材料均為志愿者事先錄制好的固定句子,沒(méi)有任何復(fù)雜的事件背景可言。以測(cè)試視頻當(dāng)中的單詞為例,這款類似的人工智能唇讀的軟件中有51個(gè)特殊詞匯,而此次谷歌選取的BBC節(jié)目數(shù)據(jù)庫(kù)卻包含了驚人的17500個(gè)特殊詞匯。在沒(méi)有任何背景介紹的情況下直接對(duì)BBC節(jié)目的嘉賓進(jìn)行唇語(yǔ)解讀,如果完全采用人工,工作量之大無(wú)法想象,因此對(duì)于人工智能而言是一個(gè)巨大的挑戰(zhàn)。
為了避免視頻流與音頻流不同步的障礙,團(tuán)隊(duì)采取了讓計(jì)算機(jī)先學(xué)會(huì)完全同步的音視頻流,掌握發(fā)音與唇形間的關(guān)聯(lián),進(jìn)而自行推斷音視頻流中哪些畫(huà)面是不同步的,再進(jìn)行自動(dòng)修正。
來(lái)自牛津大學(xué)里普耐特研究團(tuán)隊(duì)的阿薩埃爾對(duì)此技術(shù)的評(píng)價(jià)是:“我們相信人工智能唇讀技術(shù)是一種非常實(shí)用的輔助性技術(shù),比如更智能的助聽(tīng)器。此外,人工智能技術(shù)還可應(yīng)用于外交、破案等領(lǐng)域,甚至可能在普及之后改變?nèi)藗兊纳睢?br>
人工智能業(yè)內(nèi)專家稱:“這絕對(duì)是建構(gòu)全自動(dòng)唇讀系統(tǒng)的第一步!現(xiàn)有的各類龐大數(shù)據(jù)庫(kù)完全可以支持深度學(xué)習(xí)技術(shù)的發(fā)展。”


相關(guān)文章




精彩導(dǎo)讀
熱門(mén)資訊
關(guān)注我們