成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    業界 正文
    發私信給小七
    發送

    0

    開源新標桿!商湯 SenseNova-MARS超 Gemini-3-Pro,模型代碼數據全開放。

    本文作者: 小七   2026-01-30 10:45
    導語:商湯開源SenseNova-MARS,突破多模態搜索推理天花板。

    今日,商湯正式開源多模態自主推理模型 SenseNova-MARS(8B/32B 雙版本),其在多模態搜索與推理的核心基準測試中以 69.74 分超越Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。

    SenseNova-MARS是首個支持動態視覺推理和圖文搜索深度融合的 Agentic VLM 模型,它能自己規劃步驟、調用工具,輕松搞定各種復雜任務,讓AI真正具備“執行能力”。

    在MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA等基準測試中,SenseNova-MARS取得開源模型中的 SOTA 成績,還超越Gemini-3.0-Pro、GPT-5.2等頂級閉源模型,在搜索推理和視覺理解兩大核心領域全面領跑。更多細節請參見技術報告(https://arxiv.org/abs/2512.24330),歡迎開發者、各行業用戶測試與體驗。

    全能冠軍,自主解決復雜問題

    SenseNova-MARS在多項多模態搜索評測中展現出明顯的領先優勢,平均得分達到 69.74 分,成功超過了 Gemini-3-Pro 的 69.06 分與 GPT-5.2 的 67.64 分。

     開源新標桿!商湯 SenseNova-MARS超 Gemini-3-Pro,模型代碼數據全開放。在 MMSearch 榜單(圖文搜索核心評測)中,模型以 74.27 分登頂,超GPT-5.2(66.08 分);HR-MMSearch(高清細節搜索評測)中以54.43 分領先,顯著拉開與閉源模型的差距。

    開源新標桿!商湯 SenseNova-MARS超 Gemini-3-Pro,模型代碼數據全開放。

    HR-MMSearch的測試題目堪稱“AI界的奧林匹克”:采用305張2025年最新的4K超高清圖片,確保AI無法依賴舊知識“作弊”;所有問題都針對圖片中占比不到5%的細節,比如小標志、小字、微小物體,必須用圖像裁剪工具才能看清;覆蓋體育、娛樂文化、科學技術、商業金融、游戲、學術研究、地理旅行等八大領域,60%的問題都需要至少使用三種工具才能解答。 

    簡單說,無論是需要“查遍全網”的知識密集型任務,還是需要“火眼金睛”的細粒度視覺分析,它都是當前的“全能冠軍”。


    用組合拳,解決真實場景問題

    SenseNova-MARS還能實實在在落地到我們生活和工作的場景,解決需要“多步驟推理+多工具協作”的問題。

    普通AI的工具調用,要么只能搜文字,要么只能看圖片,遇到需要“先放大細節、再識別物體、最后查背景”的復雜任務就束手無策。

     開源新標桿!商湯 SenseNova-MARS超 Gemini-3-Pro,模型代碼數據全開放。


    面對識別賽車服微小 Logo + 查詢公司成立年份 + 匹配車手出生年月 + 計算差值’的復雜任務,SenseNova-MARS 可自主調用圖像裁剪、文本 / 圖像搜索工具,無需人工干預完成閉環解答。


    開源新標桿!商湯 SenseNova-MARS超 Gemini-3-Pro,模型代碼數據全開放。

    SenseNova-MARS能從產品和行業峰會的照片中,識別企業的標志,快速搜集產品、企業的信息,以及時間、數量、參數等細節要素,輔助分析行業情況和格局。

    開源新標桿!商湯 SenseNova-MARS超 Gemini-3-Pro,模型代碼數據全開放。


    SenseNova-MARS能從賽事照片中識別畫面中的Logo、人物等信息,追溯比賽或人員背景信息,幫助快速補充重要細節。

    開源新標桿!商湯 SenseNova-MARS超 Gemini-3-Pro,模型代碼數據全開放。


    SenseNova-MARS甚至能夠輕松處理,這類超長步驟的多模態推理,和超過三種工具調用,自動裁剪分析細節、搜索相關研究數據,快速驗證假設,得出關鍵判斷。

     

    擁有這種“自主思考+多工具協作”的能力,SenseNova-MARS能夠自動解決“細節識別 + 信息檢索 + 邏輯推理”復雜任務,幫助實現工作效率提升。

    •  圖像裁剪:能精準聚焦圖片上的微小細節,哪怕是占比不到5%的細節——比如賽車手衣服上的微小Logo、賽事照片里觀眾席的標語,都可通過裁剪放大清晰分析。

    • 圖像搜索:能在看到物體、人物或場景,的瞬間自動匹配相關信息——比如識別出賽車手的身份,或是某款冷門設備的型號。

    •  文本搜索:能快速抓取精準信息——無論是公司成立年份、人物出生年月,還是最新的行業數據,都能秒級獲取。

     

    從練中學, 形成"直覺"和"經驗"

    SenseNova-MARS采用了“因材施教”的訓練方法。

    • 第一階段:打基礎。針對跨模態多跳搜索推理訓練數據稀缺的痛點,創新性的提出了基于多模智能體的自動化數據合成引擎,采用細粒度視覺錨點 + 多跳深度關聯檢索的機制,動態挖掘并關聯跨網頁實體的邏輯,自動化構建高復雜度的多跳推理鏈路,同時引入閉環自洽性校驗來去除幻覺數據,構造出具備嚴密邏輯鏈條與高知識密度的多跳搜索問答數據。用精心篩選的“高難度案例”做教材,每個案例都標注了“該用什么工具、步驟是什么”,讓AI先學會基本的“破案邏輯”。這些案例都是從海量數據中挑出的“硬骨頭”,確保AI一開始就接觸真實復雜場景。

    • l第二階段:練實戰。采用“強化學習”——就像偵探在一次次破案中積累經驗,AI每做對一次決策(比如選對工具、步驟合理)就會獲得獎勵,做錯了就調整策略。為了避免AI“學偏”,研究團隊還加了個“穩定器”——BN-GSPO算法,讓它在處理簡單題和復雜題時都能保持穩定進步,不會出現“偏科”。 這種基于雙階段歸一化的優雅機制有效平滑了動態工具調用返回分布多樣性帶來的優化波動并確保了學習信號分布的一致性,從而成功解決了跨模態多步多工具智能體訓練過程中的收斂性難題。

    經過這樣的訓練,AI不僅學會了用工具,更培養"工具使用直覺"——知道在什么情況下應該使用哪些工具,以及如何將不同工具的結果有機結合起來。


     模型、代碼、數據全開源

    商湯日日新SenseNova-MARS模型、代碼、數據集全開源,支持 Hugging Face 直接下載。

    Github 倉庫:

    https://github.com/OpenSenseNova/SenseNova-MARS

    模型倉庫:

    32B:

    https://huggingface.co/sensenova/SenseNova-MARS-32B

    8B

    https://huggingface.co/sensenova/SenseNova-MARS-8B

    技術報告:

    https://arxiv.org/abs/2512.24330


    雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

    分享:
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說