<匯港通訊> 2024 世界人工智能大會(WAIC 2024)今日於上海揭幕,商湯(00020)推出首個向廣大用戶開放的可控人物視頻生成大模型Vimi,該模型更獲頒WAIC展覽展示最高榮譽「鎮館之寶」殊榮,成為本屆大會最具創新展品。Vimi基於商湯日日新大模型的強大能力,只需要一張任何風格的照片就能生成和目標動作一致的人物類短片,並支持多種驅動方式,可通過已有人物影片、動畫、聲音、文字等多種元素進行驅動。
商湯指,Vimi可通過一張照片生成人物短片。首次實現分鐘級可控、唯美人物短片生成。
Vimi將完全向廣大用戶開放使用。用戶只需上傳不同角度的高清人物照片,即可自動生成數字分身和不同風格的寫真短片。由Vimi生成的短片人物不再只是呆板的五官運動,而是搭配手勢、肢體動作、頭髮等,形成更完整的人物動作,讓創作者可基於生成的短片素材進行剪輯和二次創作。
目前,行業中80%短片都以人物為主要題材,加上短片、直播平台崛起,以人物為主體的短片需求大幅增長。然而,市面上缺少可控人物視頻生成的AIGC產品,導致內容創作者的效率有待提升。Vimi恰恰填補了此需求,為廣大短片創作者提供簡單又好用的創作工具,可廣泛應用於人物類短片的創作。
Vimi以商湯日日新大模型體系為基礎,結合商湯在計算機視覺領域的多年技術經驗,能够精準識別和理解複雜的人物圖片,並通過強大的AIGC能力,生成和諧、穩定的短片內容。
Vimi已在商湯科技官網開放預約,並將在7月5日商湯科技舉辦的「大愛無疆·向新力」人工智能論壇上披露更多細節。 (SY)
新聞來源 (不包括新聞圖片): 滙港資訊