成人av在线资源一区,亚洲av日韩av一区,欧美丰满熟妇乱XXXXX图片,狠狠做五月深爱婷婷伊人,桔子av一区二区三区,四虎国产精品永久在线网址,国产尤物精品人妻在线,中文字幕av一区二区三区欲色
    您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
    此為臨時鏈接,僅用于文章預覽,將在時失效
    人工智能 正文
    發私信給我在思考中
    發送

    0

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    本文作者: 我在思考中 2024-04-28 12:09
    導語:該模型全開源,無條件免費商用 .

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入


    人類獲取的信息83%來自視覺,圖文多模態大模型能感知更豐富和精確的真實世界信息,構建更全面的認知智能,從而向AGI(通用人工智能)邁出更大步伐。

    元象今日發布多模態大模型 XVERSE-V ,支持任意寬高比圖像輸入,在主流評測中效果領先。該模型全開源,無條件免費商用 ,持續推動海量中小企業、研究者和開發者的研發和應用創新。

    XVERSE-V 性能優異,在多項權威多模態評測中超過零一萬物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等開源模型,在綜合能力測評MMBench中超過了谷歌GeminiProVision、阿里Qwen-VL-Plus和Claude-3V Sonnet等知名閉源模型。

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入
    圖. 多模態大模型綜合評測



    1

    融合整體和局部的高清圖像表示

    傳統的多模態模型的圖像表示只有整體,XVERSE-V  創新性地采用了融合整體和局部的策略,支持輸入任意寬高比的圖像。兼顧全局的概覽信息和局部的細節信息,能夠識別和分析圖像中的細微特征,看的更清楚,理解的更準確。

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    注:Concate* 表示按列進行拼接

    這樣的處理方式使模型可以應用于廣泛的領域,包括全景圖識別、衛星圖像、古文物掃描分析等。

    示例- 高清全景圖識別 、圖片細節文字識別

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    免費下載大模型

    • Hugging Face:https://huggingface.co/xverse/XVERSE-V-13B

    • ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-V-13B

    • Github:https://github.com/xverse-ai/XVERSE-V-13B

    • 問詢發送:opensource@xverse.cn

    商業合作

    微信添加:lixing_lixing

    元象持續打造國內開源標桿,在國內最早開源最大參數65B 全球最早開源最長上下文256K  以及  國際前沿的MoE模型, 并在SuperCLUE測評全國領跑此次推出MoE模型, 填補國產開源空白,更將其 推向了國際領先水 平。

    商業應用上,元象大模型是 廣東最早獲得國家備案的模型之一  ,可向全社會提供服務。元象大模型去年起已和多個騰訊產品,包括 QQ音樂  、虎牙直播、全民K歌、騰訊云等,進行深度合作與應用探索,為文化、娛樂、旅游、金融領域打造創新領先的用戶體驗。

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入



    2

     多方向實際應用表現突出

    模型不僅在基礎能力上表現出色,在實際的應用場景中也有著出色的表現。具備不同場景下的理解能力,能夠處理信息圖、文獻、現實場景、數理題目、科學文獻、代碼轉化等不同需求。

    • 圖表理解

    不論是復雜圖文結合的信息圖理解,還是單一圖表的分析與計算,模型都能夠自如應對。

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    • 視障真實場景

    在真實視障場景測試集VizWiz中,XVERSE-V 表現出色,超過了InternVL-Chat-V1.5、DeepSeek-VL-7B 等幾乎所有主流的開源多模態大模型。該測試集包含了來自真實視障用戶提出的超過31,000個視覺問答,能準確反映用戶的真實需求與瑣碎細小的問題,幫助視障人群克服他們日常真實的視覺挑戰。

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    VizWiz測試示例

    • 看圖內容創作

    XVERSE-V 具備多模態能力的同時保持強大的文本生成能力,能夠很好勝任理解圖像后創造性文本生成的任務。

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入  

    • 教育解題

    模型具備了廣泛的知識儲備和邏輯推理能力,能夠識別圖像解答不同學科的問題。

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    • 百科解答

    模型儲備了歷史、文化、科技、安全等各類主題的知識。

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    • 代碼撰寫

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    • 自動駕駛

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    • 情感理解與識別

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    元象公司介紹
                   

    一元復始,萬象更新。元象 XVERSE 于 2021 年初在深圳成立,是國內領先的 AI 與 3D 技術服務公司,致力于打造 AI 驅動的 3D 內容生產與消費一站式平臺,愿景為“定義你的世界”。

    元象創始人姚星是前騰訊副總裁和騰訊 AI Lab 創始人、國家科技部新一代人工智能戰略咨詢委員會成員。元象累計融資金額超過 2 億美元,投資機構包括騰訊、高榕資本、五源資本、高瓴創投、紅杉中國、淡馬錫和CPE源峰等。

    元象獲國家“專精特新”、“高新技術企業”認證,團隊目前有75%為研發人員(60%為碩博學歷)。公司積極推動前沿技術自主研發,在3D領域,自研行業引領性的“端云協同” 3D 互動技術,開創零門檻(輕)、一站式(快)、高品質(美)全新 3D 體驗;在AI領域,公司最早開源國內最大參數大模型(650億)、世界最長上下文長度(256K)在內的一系列高性能大模型,免費可商用,將國產開源提升至國際一流水平,積極推動大模型國產可替代和行業應用發展。

    元象已經為多家龍頭企業提供一站式技術與服務,包括:澳門大三巴、南京大報恩寺、央視、騰訊音樂TMELAND、華為、一汽大眾、阿迪達斯、中國平安、中科院深圳先進院等。

    公司注冊名:深圳元象信息科技有限公司

    官網:www.XVERSE.cn

    官微:元象 XVERSE

    Logo下載

    鏈接: https://pan.baidu.com/s/1fB-zoITVJZ7Znv5IVe-fZg 

    提取碼: rav0 

    雷峰網(公眾號:雷峰網)


    雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知

    元象首個多模態大模型 XVERSE-V 開源,刷新權威大模型榜單,支持任意寬高比輸入

    分享:
    相關文章
    當月熱門文章
    最新文章
    請填寫申請人資料
    姓名
    電話
    郵箱
    微信號
    作品鏈接
    個人簡介
    為了您的賬戶安全,請驗證郵箱
    您的郵箱還未驗證,完成可獲20積分喲!
    請驗證您的郵箱
    立即驗證
    完善賬號信息
    您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
    立即設置 以后再說