在今年的I/O開發者大會上,谷歌帶來了一項令人矚目的技術突破——新一代視頻生成模型Veo3。這款模型不僅標志著谷歌在視頻合成領域的重大進步,還因其能生成視頻背景音效而備受矚目。
據谷歌介紹,Veo3不僅能夠合成逼真的畫面,還能為各種場景,如鳥鳴、街頭交通等,配上相應的音效。更令人驚嘆的是,它甚至能生成人物對話,使得生成的視頻內容更加生動和真實。這一技術的實現,無疑將極大地推動影視制作行業的發展。
除了音效生成外,Veo3在物理模擬與口型同步方面也展現出了卓越的性能。這意味著,生成的視頻內容在視覺和聽覺上都將更加貼近真實世界,難以被辨識為AI生成的作品。
然而,目前Veo3的開放范圍還相對有限。谷歌表示,該模型目前僅面向美國地區的Gemini Ultra用戶和Vertex AI的企業用戶開放。同時,Veo3已經集成進了谷歌的AI影視制作工具Flow中,使得用戶能夠更加方便地使用這一先進技術。
對于已經在使用Flow的用戶來說,Veo3的加入無疑將帶來更加豐富的創作體驗。用戶可以通過Flow使用鏡頭控制功能,對生成的視頻內容進行旋轉、縮放等操作,甚至可以將畫面從豎屏調整為橫屏。用戶還可以在視頻中添加或刪除元素,使得最終的作品更加符合自己的創作意圖。
隨著AI生成技術的不斷發展,用戶越來越難以辨別出哪些是AI生成的內容。為了應對這一問題,谷歌推出了SynthID Detector工具。用戶可以通過上傳媒體文件,檢測其是否包含SynthID水印,從而判斷該內容是否為AI生成。然而,需要注意的是,目前并非所有的圖像生成模型都支持這一水印功能。
盡管Veo3的開放范圍還相對有限,但谷歌I/O開發者大會仍在如火如荼地進行中。我們有理由相信,隨著技術的不斷進步和應用的不斷拓展,Veo3將有望在未來為更多的用戶帶來更加便捷和高效的影視制作體驗。