0
| 本文作者: Nemo | 2025-06-11 14:20 |
近日,中國信息通信研究院(以下簡稱“中國信通院”)完成可信AI多模態大模型首輪評估。商湯日日新SenseNova融合模態大模型在所有模型中,獲得當前最高評級——4+級,成為國內首家獲得最高評級的大模型。

可信AI多模態大模型評估2025年1月啟動,由中國信通院人工智能研究所牽頭,依據由業界60余家單位共同編制的《多模態大模型技術要求和評估方法》標準開展,是國內最影響力和權威的多模態大模型測評之一。
評估包含基礎能力、理解能力、生成能力、專項測試四個模塊,共計2個能力域,30余個能力項,為多模態大模型的技術研發、應用落地等方面提供規范與指導。
結果顯示,在基礎能力方面,商湯日日新融合模態大模型在多模態融合、多模態轉換、跨模態感知、跨模態理解、跨模態生成能力項中表現優異,具備扎實的技術能力。在模型應用方面,商湯日日新融合模態大模型在行業覆蓋度、場景支持度、應用形態多樣性、易用性能力項中表現優異,具備穩健的應用能力。
早在今年 1 月,商湯科技推出日日新融合大模型,在行業率先實現原生融合模態,引領了大語言模型和多模態大模型的一統化大潮。今年4月,商湯升級日日新SenseNova V6版本,通過多模態長思維鏈訓練、全局記憶、強化學習等關鍵技術,實現多模態推理能力突破。由此商湯日日新V6可自然融合文本、圖像、視頻、語音等多形態信息,解決復雜場景下的綜合問題。
例如,在實時音視頻交互方面,商湯日日新V6擁有強大的實時交互、視覺識別、記憶思考、持續對話和復雜推理等能力,能幫助AI與人類更自然、更流暢地交流,帶來創新人機交互體驗。在視頻生成方面,商湯日日新V6具備多模態視頻解析能力,支持10分鐘級視頻全幀率解析,并可根據解析內容產出新的視頻內容。
目前,商湯日日新大模型已在教育、金融、工業等多個領域實現場景落地。此次首批通過可信AI多模態大模型評估并獲最高評級認證,意味著商湯日日新不僅已具備行業領先的多模態推理能力,還能很好地滿足各行各業真實場景中對模型通用性、泛化性和專業性的嚴格要求,為行業可信發展提供堅實基礎。
關于商湯
作為人工智能軟件公司,商湯科技以“堅持原創,讓AI引領人類進步”為使命,旨在持續引領人工智能前沿研究,持續打造更具拓展性更普惠的人工智能軟件平臺,推動經濟、社會和人類的發展,并持續吸引及培養頂尖人才,共同塑造未來。
商湯科技擁有深厚的學術積累,并長期投入于原創技術研究,不斷增強行業領先的多模態、多任務通用人工智能能力,涵蓋感知智能、自然語言處理、決策智能、智能內容生成等關鍵技術領域,同時包含AI芯片、AI傳感器及AI算力基礎設施在內的關鍵能力。此外,商湯前瞻性打造新型人工智能基礎設施——商湯AI大裝置SenseCore,打通算力、算法和平臺,并在此基礎上建立“商湯日日新SenseNova”大模型及研發體系,以低成本解鎖通用人工智能任務的能力,推動高效率、低成本、規模化的AI創新和落地,進而打通商業價值閉環,解決長尾應用問題,引領人工智能進入工業化發展階段。
商湯倡導“發展”的人工智能倫理觀,并積極參與有關數據安全、隱私保護、人工智能倫理道德和可持續人工智能的行業、國家及國際標準的制訂,與多個國內及多邊機構就人工智能的可持續及倫理發展開展了密切合作。商湯《AI可持續發展道德準則》被聯合國人工智能戰略資源指南選錄,并于2021年6月發表,是亞洲唯一獲此殊榮的人工智能公司。
目前,商湯科技已于香港交易所主板掛牌上市。商湯在香港、上海、北京、深圳、成都、杭州、西安、新加坡、曼谷、吉隆坡、利雅得、阿布扎比、迪拜、首爾等地設立辦公室。 另外,商湯科技在德國、泰國、印度尼西亞、菲律賓等國家均有業務。更多信息,請訪問商湯科技網站、微信、微博和領英。
媒體聯絡及查詢
商湯科技
郵箱:pr@sensetime.com
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。