近日,小米自研聲音識別算法取得最新進展,算法模型領先其他機構,性能國際排名第一。小米是在 Google 發布的 AudioSet 音頻標記任務中獲得的這一突破。
它是音頻標記任務影響力最大的數據集,被認為是聲音領域的 ImageNet (注:計算機視覺領域最著名的數據集,由著名學者李飛飛等主持發布),權威性頗高。
Google 將 AudioSet 數據集分為三個子集,前兩個子集用于訓練,被合并稱為 “AudioSet-2M”。正是在這個合并后的訓練集中,小米的聲音識別算法模型首次在業界突破了50 mAP,刷新了音頻標記技術指標,成為截至目前性能最好的模型。
此外,小米還發布了一個 Mini 版模型,適合資源受限的場景。該模型的參數量被壓縮到了原模型的約九分之一,遠小于其他機構的模型,但性能卻優于其他所有機構。
這項技術的突破意味著小米的聲音識別算法能力再次精進,小米的眾多智能硬件設備應用此項技術后,可以更敏銳地捕捉和識別環境聲音,大幅提升硬件的智能化程度,從而為用戶創造更加便捷的智能生活體驗。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。