3月1日消息,阿里巴巴集團智能計算研究院日前上線了一款新的AI圖片-音頻-視頻模型技術EMO,官方稱其為“一種富有表現力的音頻驅動的肖像視頻生成框架。
據悉,用戶只需要提供一張照片和一段任意音頻文件,EMO即可生成會說話唱歌的AI視頻,以及實現無縫對接的動態小視頻,最長時間可達1分30秒左右。表情非常到位,任意語音、任意語速、任意圖像都可以一一對應。
比如《狂飆》電視劇中“高啟強”暢談羅翔普法;某人的一張圖片,就能通過其他音頻配合“唱出”一首rapper饒舌,連口型都幾乎一模一樣;甚至前不久OpenAI發布的Sora案例視頻里面,一位AI生成的帶墨鏡的日本街頭女主角,現在不僅能讓她開口說話,而且還能唱出好聽的歌曲。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。