搜索
当前所在位置:首页 >> 爆榜

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

发布时间:2025-09-09 08:41:43 作者:ltil 点击:456 【 字体:

[雷峰网(公众号:雷峰网)]两周前,面壁面壁发布领先的新模型早开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B,于L越发布时间更早,比肩综合性能相当,理超尤其是面壁武汉理工大学爆料地址拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。新模型早激活参数仅 39B,于L越支持 64k 上下文,比肩相比 Llama3 速度更快、理超可处理更长文本。面壁

面壁新模型:早于Llama3、新模型早比肩 Llama3、于L越推理超越 Llama3!比肩

图注:面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中,刷新开源大模型推理性能 SOTA。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

图注:面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B,超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b,以及闭源模型 GPT-3.5-turbo。

 

Eurux-8x22B 由 Mistral-8x22B对齐而来。强劲战斗力,来自面壁 Ultra 对齐工艺上新 UltraInterat 大规模、高质量对齐信息集。此前,面壁 Ultra 对齐系列信息集已经“强壮”了全球超 200 个大模型,堪称大模型上分神器。

 

Eurux-8x22B模型+对齐信息集,全家桶开源:

https://github.com/OpenBMB/Eurus

https://huggingface.co/openbmb/Eurux-8x22b-nca

开源大模型「理科状元」

开源大模型「理科状元」

复杂推理能力是体现大模型性能差异的最核心能力之一,也是大模型真正落地应用所需的关键能力所在。

Eurux-8x22B 在代码和数学等复杂推理的综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA,堪称「理科状元」。特别在 LeetCode (180道LeetCode真题)和 TheoremQA(美国大学水准的STEM题目)这两个具有挑战性的基准测试中,超过现有开源模型。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

图注:Eurux-8x22B 在代码和数学等复杂推理综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA。


开源大模型「理科状元」Eurux-8x22B在实际应用中表现如何呢?


在近期 LeetCode 周赛,这一检验人类程序员编程能力的真实竞技场上:Eurux-8x22B 在 Python 编程方面取得综合排名超越了80% 的人类参赛选手的优秀成绩,成功解决四道运算规则题中的三道,可以初步通过互联网大厂的程序员编程面试。


下面是本次周赛中Eurux-8x22B对一道中等难度的运算规则题的真实解答:

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!


除了代码能力优秀,Eurux-8x22B 解答数学题也是轻而易举。


例如给它一道高中排列组合题,Eurux-8x22B 首先给出了清晰的解题思路,然后一步步地拆解执行,再进行结果汇总,最后得到正确答案。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

再考察它一道代数题,Eurux-8x22B 直击要害,运用二项式定理,清晰简洁地给出了正确的解答。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

接着给它一道向量代数题,Eurux-8x22B 也能轻松拿下。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

高考函数题可能是令很多人回忆起来就头疼的一类题,Eurux-8x22B 也能解答无误。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

(需要说明的是,Eurux-8x22B 没有针对中文语料进行额外的微调和对齐!)

面壁 Ultra 对齐工艺,大模型上分神器!

本次大模型「理科状元」 Eurux-8x22B 的优异表现,得益于来自面壁 Ultra 对齐工艺的大规模、高质量对齐信息集UltraInteract上新。

好信息,才有好模型。此前,面壁 Ultra 对齐工艺已经“强壮”了全球超 200 个大模型,堪称大模型上分神器。

 ➤  UltraInterat对齐信息集地址:

? https://github.com/OpenBMB/Eurus

UltraInteract是专门设计用于提升大模型推理能力的大规模、高质量的对齐信息集,包含了覆盖数学、代码和逻辑推理问题的12个开源信息集的86K条指令和220K偏好对,共有五十万(条)左右信息。相比而言,LLaMA 3-70B模型则是使用了千万量级的对齐信息,这从侧面证明了 UltraInteract 信息集的优质性——信息质量胜过信息数量。UltraInteract 信息集开源后在社区受到了广泛好评。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

从领先的端侧模型「小钢炮」MiniCPM,到开源模型推理新 SOTA 的Eurux-8x22B,为什么面壁智能总能推出同等参数、性能更优的「高效大模型」?答案是,大模型是一项系统工程,而面壁作为国内极少数兼具大模型运算规则与 infra 能力的团队,拥有自研的全流程高效生产线:面壁 Ultra 对齐工艺、Infra 工艺、独家「模型沙盒」实验和现代化信息工厂,从信息、训练到调校工艺环环相扣,一条优秀的大模型Scaling Law增长曲线由此而生。

Infra工艺方面,面壁构建了全流程优化加速工具套件平台ModelForce,可以实现 10 倍推理加速,90% 成本降低。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

运算规则方面,通过上千次以上的「模型沙盒」实验,探索更加科学的训模方法。以小见大,寻找高效模型训练配置,实现模型能力快速形成。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

➤  Eurux-8x22B模型GitHub地址:

https://github.com/OpenBMB/Eurus

 ➤  Eurux-8x22B模型HuggingFace地址:https://huggingface.co/openbmb/Eurux-8x22b-nc

 ➤  UltraInterat对齐信息集地址:

https://github.com/OpenBMB/Eurus





雷峰网版权文章,未经授权禁止转载。详情见转载须知。

面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

阅读全文
相关推荐

阿里国际AI进展:日均调用量已破10亿次,获 WAIC 2025「SAIL之星」

阿里国际AI进展:日均调用量已破10亿次,获 WAIC 2025「SAIL之星」
7月26日,2025世界人工智能大会卓越人工智能引领者SAIL奖公布,阿里国际跨境电商AI解决方案Marco斩获本届SAIL之星,成为该领域的首个获得者。Marco由阿里国际AI Business团队 ...

“比流言碎语先来的是妈妈的爱!” 甜馨的“反PUA”真是无敌了!

“比流言碎语先来的是妈妈的爱!” 甜馨的“反PUA”真是无敌了!
前两天,甜馨在社交平台上晒出了自己小时候和妈妈的合照,下面还配了一行字:“比流言碎语先来的是妈妈的爱”短短13个字,足以窥见这个女孩的清醒和坚定。记忆里那个脸蛋圆圆又软萌的小姑娘一下子长大了,好像手拿 ...

中共中央批准,开除田志强党籍

中共中央批准,开除田志强党籍
据海南省纪委监委7月28日消息:经海南省委批准,海南省纪委监委对第八届海南省委委员、琼海市委原书记田志强严重违纪违法问题进行了立案审查调查。田志强资料图)经查,田志强丧失理想信念,背弃初心使命,弃守政 ...

郭晶晶入选国际游泳名人堂,与霍启刚、霍震霆合影居C位,霍启刚发文

郭晶晶入选国际游泳名人堂,与霍启刚、霍震霆合影居C位,霍启刚发文
7月28日,@霍启刚发文:“ 今年世界游泳锦标赛在新加坡举办,周末我专程飞到新加坡,除了观赏世界游泳锦标赛赛事,也是为了现场见证晶晶以及我们的好朋友陈若琳入选国际游泳名人堂,可喜可贺。”霍启刚称,其实 ...

50%关税,正式生效!印度部分工厂“停工”

50%关税,正式生效!印度部分工厂“停工”
当地时间27日,美国正式开始对印度输美产品征收50%关税。印度皮革及钻石加工等行业受到严重冲击,随着美国客户陆续取消订单,不少工厂都面临经营困境。位于印度北方邦的坎普尔是该国有名的皮革加工中心,聚集着 ...

释永信徒弟:十年前就举报师父,当过奥运火炬手,自称少林总教头

释永信徒弟:十年前就举报师父,当过奥运火炬手,自称少林总教头
十年前也就是2015年,释永信就曾被徒弟释延鲁举报养情妇、有私生子、侵占少林财产等问题。可惜的是,当年释延鲁的举报,并未扳倒释永信。反而是在调查后,以释永信全身而退结束那场闹剧,甚至是调查结果都在新闻 ...

这些区域易积水!北京海淀发布积水内涝蓝警

这些区域易积水!北京海淀发布积水内涝蓝警
7月27日16时30分,海淀区水务局、海淀区气象局联合发布积水内涝蓝色预警:根据最新气象预报,7月27日傍晚至28日上午我区有大雨,局地暴雨,部分地区小时雨强50毫米以上或6小时累计雨量70毫米以上, ...

泰国曼谷一市场发生枪击事件 已致多人伤亡

泰国曼谷一市场发生枪击事件 已致多人伤亡
总台记者获悉,当地时间7月28日,泰国曼谷一市场发生枪击事件。据当地媒体报道,事件已致3人死亡。总台记者 宋焕钰) ...

Hinton与姚期智对谈:认为人类的意识特殊,那是危险的无稽之谈

Hinton与姚期智对谈:认为人类的意识特殊,那是危险的无稽之谈
那个因为腰痛而坐不下的男人,终于还是在WAIC坐下了,对面则是同为图灵奖得主、上海期智研究院院长姚期智先生。Geoffery Hinton给大家带来了几个话题与故事,几乎每一个都是关于人与AI的。第一 ...

少林寺住持释永信被查,时间线梳理

少林寺住持释永信被查,时间线梳理
来源:今视频长天新闻#少林寺住持释永信被查# [少林寺住持释永信被查,时间线梳理]7月26日上午,少林寺方丈释永信微博突然停更的消息冲上热搜,其最近一条微博的发布时间为7月24日早6时58分。#释永信 ...

柬埔寨和泰国同意“无条件”停火

柬埔寨和泰国同意“无条件”停火
新华社马来西亚布特拉加亚7月28日电记者王嘉伟 毛鹏飞)在马来西亚总理安瓦尔主持下,柬埔寨和泰国28日举行会谈并同意从当日24时起“立刻且无条件”停火,结束两国持续数日的边境冲突。当天下午,柬埔寨首相 ...

美国与欧盟达成15%税率关税协议

美国与欧盟达成15%税率关税协议
来源:财联社财联社7月28日电,据央视新闻,美国总统特朗普27日表示,美国已与欧盟达成15%税率的关税协议。特朗普表示,欧盟将比此前增加对美国投资6000亿美元,欧盟将购买美国军事装备,并将购买150 ...
返回顶部