搜索
当前所在位置:首页 >> 风事台

元象首个多模态大模型 XVERSE

发布时间:2025-09-10 13:00:14 作者:optd 点击:1 【 字体:

元象首个多模态大模型 XVERSE-V 开源,元象刷新权威大模型榜单,多模支持任意宽高比输入


人类获取的信息83%来自视觉,图文多模态大模型能感知更丰富和精确的元象真实世界信息,构建更全面的多模认知智能,从而向AGI(通用机器智能)迈出更大步伐。模型韩国外派女员工不雅合集

元象今日发布多模态大模型 XVERSE-V ,元象支持任意宽高比图像输入,多模在主流评测中效果领先。模型该模型全开源,元象无条件免费商用 ,多模持续推动海量中小企业、模型研究者和开发者的元象研发和应用创新。

XVERSE-V 性能优异,多模在多项权威多模态评测中超过零一万物Yi-VL-34B、模型面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型,在综合能力测评MMBench中超过了谷歌GeminiProVision、朱某私密聊天合集阿里Qwen-VL-Plus和Claude-3V Sonnet等知名闭源模型。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
图. 多模态大模型综合评测



1

融合整体和局部的高清图像表示

传统的多模态模型的图像表示只有整体,XVERSE-V  创新性地采用了融合整体和局部的策略,支持输入任意宽高比的图像。兼顾全局的概览信息和局部的细节信息,能够识别和分析图像中的细微特征,看的更清楚,理解的更准确。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

注:Concate* 表示按列进行拼接

这样的处理方式使模型可以应用于广泛的领域,包括全景图识别、卫星图像、古文物扫描分析等。

示例- 高清全景图识别 、图片细节文字识别

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

免费下载大模型

  • Hugging Face:https://huggingface.co/xverse/XVERSE-V-13B

  • ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-V-13B

  • Github:https://github.com/xverse-ai/XVERSE-V-13B

  • 问询发送:opensource@xverse.cn

商业合作

微信添加:lixing_lixing

元象持续打造国内开源标杆,在国内最早开源最大参数65B 、全球最早开源最长上下文256K  以及  国际前沿的MoE模型, 并在SuperCLUE测评全国领跑。此次推出MoE模型, 填补国产开源空白,更将其 推向了国际领先水 平。

商业应用上,元象大模型是 广东最早获得国家备案的模型之一  ,可向全社会提供支持。元象大模型去年起已和多个腾讯产物,包括 QQ音乐  、虎牙实况、全民K歌、腾讯云等,进行深度合作与应用探索,为文化、娱乐、旅游、金融领域打造创新领先的客户体验。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入



2

 多方向实际应用表现突出

模型不仅在基础能力上表现出色,在实际的应用场景中也有着出色的表现。具备不同场景下的理解能力,能够处理信息图、文献、现实场景、数理题目、科学文献、代码转化等不同需求。

  • 图表理解

不论是复杂图文结合的信息图理解,还是单一图表的分析与计算,模型都能够自如应对。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 视障真实场景

在真实视障场景测试集VizWiz中,XVERSE-V 表现出色,超过了InternVL-Chat-V1.5、DeepSeek-VL-7B 等几乎所有主流的开源多模态大模型。该测试集包含了来自真实视障客户提出的超过31,000个视觉问答,能准确反映客户的真实需求与琐碎细小的问题,帮助视障人群克服他们日常真实的视觉挑战。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

VizWiz测试示例

  • 看图内容创作

XVERSE-V 具备多模态能力的同时保持强大的文本生成能力,能够很好胜任理解图像后创造性文本生成的任务。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入 

  • 教育解题

模型具备了广泛的知识储备和逻辑推理能力,能够识别图像解答不同学科的问题。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 百科解答

模型储备了历史、文化、科技、保障等各类主题的知识。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 代码撰写

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 自动驾驶

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

  • 情感理解与识别

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

元象公司介绍
               

一元复始,万象更新。元象 XVERSE 于 2021 年初在深圳成立,是国内领先的 AI 与 3D 工艺支持公司,致力于打造 AI 驱动的 3D 内容生产与消费一站式平台,愿景为“定义你的世界”。

元象创始人姚星是前腾讯副总裁和腾讯 AI Lab 创始人、国家科技部新一代机器智能战略咨询委员会成员。元象累计融资金额超过 2 亿美元,投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。

元象获国家“专精特新”、“高新工艺企业”认证,团队目前有75%为研发人员(60%为硕博学历)。公司积极推动前沿工艺自主研发,在3D领域,自研行业引领性的“端云协同” 3D 互动工艺,开创零门槛(轻)、一站式(快)、高品质(美)全新 3D 体验;在AI领域,公司最早开源国内最大参数大模型(650亿)、世界最长上下文长度(256K)在内的一系列高性能大模型,免费可商用,将国产开源提升至国际一流水平,积极推动大模型国产可替代和行业应用增长。

元象已经为多家龙头企业提供一站式工艺与支持,包括:澳门大三巴、南京大报恩寺、央视、腾讯音乐TMELAND、华为、一汽大众、阿迪达斯、中国平安、中科院深圳先进院等。

公司注册名:深圳元象信息科技有限公司

官网:www.XVERSE.cn

官微:元象 XVERSE

Logo下载

链接: https://pan.baidu.com/s/1fB-zoITVJZ7Znv5IVe-fZg 

提取码: rav0 

雷峰网(公众号:雷峰网)


雷峰网版权文章,未经授权禁止转载。详情见转载须知。

元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入

阅读全文
相关推荐

陆虎陈曌旭首次合体大片甜度超标,他们的爱情咋这么好“磕”!

陆虎陈曌旭首次合体大片甜度超标,他们的爱情咋这么好“磕”!
甜蜜对视、默契互动,陆虎和陈曌旭的首次时尚合体拍摄简直就是大型撒糖现场!《时尚芭莎珠宝》八月刊迎来了一对特别甜蜜的CP——陆虎和陈曌旭嘘嘘)。这是俩人首次合体拍摄时尚大片,现场工作人员透露:“整个拍摄 ...

日本专家:本次参议院选举或将影响日本政局走向

日本专家:本次参议院选举或将影响日本政局走向
日本国会第27届参议院选举定于20日投票。选举在即,多项民意调查结果显示,日本自由民主党和公明党组成的执政联盟选情严峻,其获得过半数议席的目标面临挑战。日本山口大学名誉教授纐缬厚表示,本次选举可能成为 ...

网易有道全面拥抱DeepSeek

网易有道全面拥抱DeepSeek
1月20日,DeepSeek震撼发布DeepSeek-R1,这款推理大模型在数学、编程及逻辑推理等多个领域展现出了与OpenAI顶尖模型比肩的实力,同时实现了API调用成本90%-95%的大幅缩减,无 ...

这个中部省会,挤满了“霸总”?

这个中部省会,挤满了“霸总”?
在北京上大学的敏敏,家住郑州,这个暑期,她为自己制订了一项独特的兼职计划——去郑州短剧剧组工作。随着手机短剧行业的兴起,越来越多曾经的“北漂”“横漂”演员,在社交媒体上分享着他们转战郑州,出演短剧的经 ...

女性主动追爱,为何被骂“媚男”?

女性主动追爱,为何被骂“媚男”?
最近刷恋综了吗?都在聊徐如蓝。有人夸她“情商天花板”,也有人说她“魅魔操作”“心机撩汉”。当女性在感情中展现主动,污名化的标签总是来得比掌声更快。怎么女生一主动,就变成了原罪?恋综女嘉宾,被骂媚男?最 ...

韩国检方对前总统尹锡悦提出拘留起诉

韩国检方对前总统尹锡悦提出拘留起诉
当地时间19日,韩国内乱特检组对前总统尹锡悦提出拘留起诉。去年12月3日,时任韩国总统尹锡悦发布紧急戒严令。同月14日,韩国国会通过对尹锡悦的弹劾动议案,尹锡悦总统职权随即停止。今年1月15日,尹锡悦 ...

当大模型升级速度变缓,AI Infra 创业还是一门「好生意」吗?

当大模型升级速度变缓,AI Infra 创业还是一门「好生意」吗?
作者丨朱可轩编辑丨陈彩娴时至今日,如果说清华系撑起了中国大模型创业的半壁江山,那 AI Infra 这条赛道绝对是清华系「上阵师徒兵」的又一波创业豪赌:媒体所实验室孵化的清昴智能、高性能计算机研究中心 ...

视觉模型智能涌现后, Scaling Law 不会到头

视觉模型智能涌现后, Scaling Law 不会到头
Scaling Law 或将终结——这是最近备受热议的话题之一。该讨论最初源自于哈佛大学一篇名为《Scaling Laws for Precision》的论文,其研究表明当下的语言模型在大量数据上经历 ...

DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了

DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
过去一周,世界模型赛道的热度被推到新高。DeepMind 刚发布的 Genie 3 展示了交互式、实时、长序列生成的能力,让“虚拟世界随时可玩、可控”从概念变成了可见的产品形态。不过,Genie 3 ...

视觉模型智能涌现后, Scaling Law 不会到头

视觉模型智能涌现后, Scaling Law 不会到头
Scaling Law 或将终结——这是最近备受热议的话题之一。该讨论最初源自于哈佛大学一篇名为《Scaling Laws for Precision》的论文,其研究表明当下的语言模型在大量数据上经历 ...

《扫毒风暴》定档7月12日 段奕宏秦昊上演五年生死追猎

《扫毒风暴》定档7月12日 段奕宏秦昊上演五年生死追猎
来源标题:《扫毒风暴》定档7月12日 段奕宏秦昊上演五年生死追猎由陈育新编剧,五百执导,蔺水净联合执导,段奕宏、秦昊领衔主演,于文文、吴幸键、刘欢领衔主演,侯岩松特别主演,吴晓亮特邀主演,张世、胡明等 ...

切磋节上的尖叫与狂欢:《微笑一号店》不只有咖啡,还有“微笑”服务

切磋节上的尖叫与狂欢:《微笑一号店》不只有咖啡,还有“微笑”服务
来源标题:切磋节上的尖叫与狂欢:《微笑一号店》不只有咖啡,还有“微笑”服务在重庆滚烫的夏日里,一场关于温度与商业的故事正在书写。爱奇艺经营纪实互动真人秀《微笑一号店》重庆切磋节如约而至,以&ldquo ...
返回顶部