成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業界 正文
    發私信給小七
    發送

    0

    阿里通義推新一代語音模型Fun-ASR,垂直領域識別準確率提升15%以上

    本文作者: 小七   2025-08-22 18:09
    導語:阿里通義發布Fun-ASR大模型,垂直領域識別率提升15%+。

      8月22日,阿里通義發布新一代端到端的語音識別大模型Fun-ASR,該模型增強了上下文感知和高精度語音轉寫能力,在家裝、保險等多個行業場景的語音識別準確率均提升了15%以上。目前,Fun-ASR已應用于會議字幕與同傳、智能紀要、語音助手等場景,未來該模型將進一步在阿里云百煉上線。

      Fun-ASR是大語言模型驅動的語音識別算法,其基于自研語音算法和監督微調的Qwen3訓練,并采用前沿的模型架構以及先進的文本模態對齊技術,可有效保護和增強大模型的語言處理能力;此外,Fun-ASR集成了RAG方案,可提供自動化音頻信息檢索功能,最高可導入1000多個自定義熱詞。基于該功能,系統能夠根據輸入音頻精確獲取相關領域熱詞、文檔及前文記錄,大幅提升特定領域內的關鍵詞識別效果。

     

    阿里通義推新一代語音模型Fun-ASR,垂直領域識別準確率提升15%以上

    Fun-ASR架構圖

      為解決語音識別不準確、噪聲干擾、語種混淆以及生成幻覺等問題,通義團隊還在ASR模型訓練中引入了RL(強化學習)技術,此策略有效減少識別過程中的幻覺,提高整體系統的準確性與可靠性。在四川話、粵語、閩南語等多地方言上,Fun-ASR取得了領先同類產品的表現。此外,Fun-ASR對遠場拾音和近場降噪的等多樣環境也表現出了良好的適應性,無論是會議室、工位,還是超市、戶外,均可有效保證識別準確率。

      在訓練數據上,Fun-ASR基于上億小時音頻數據的訓練,全面涵蓋了互聯網、科技、家裝、畜牧、汽車等十多個領域的專業術語,在多個垂直領域的識別準確率顯著提升。實測數據顯示,Fun-ASR在保險行業的準確率較以往提升18%,在家裝、畜牧等行業也實現了15%-20%的提升。

      在音頻領域,通義實驗室已推出語音生成大模型 Cosyvoice、端到端音頻多模態大模型MinMo、音頻生成模型ThinkSound等模型,全面覆蓋語音識別、語音合成、音頻生成、音頻理解等場景。


    雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    相關文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說