Google 的 AI 又再進化了!稍早 Google 團隊與大家分享了最新的研究成果- 將影片中的聲音進行分離!也就是說大家以前在電影中看到鑑識人員用軟體來分離影片中背後雜音,然後單獨拉出想要聽的對象的聲音音軌那畫面,日後我們就能夠直接在觀賞影片的時候自行選擇想要的對象來聆聽對方說話的內容!
根據 Google 技術人員分享的結果,他們製作了一個機器學習系統,能夠將影片中的背景音和人聲做出明顯又清晰的區隔(這真的很神奇),甚至讓用戶可以自行選擇想要聽取的對象聲音,甚至結合字幕的調整,讓用戶在觀賞多人說話的影片時,能夠自行選擇想要聆聽的部分,以及顯示當時說話者的字幕。
這邊我們直接來欣賞兩段 Google 分享的成果影片,相信大家看了會對這項研究成果更有感覺。
這項技術的成功看似簡單但其實背後卻有著許多難以白話解釋的原理,而我們能確定的就是… 感謝 Google 研究人員的努力,這樣以後至少可以不用再聽到一堆嘈雜你說我說他說的畫面時,搞不清楚到底要聽誰說了!
[Google]