设为首页加入收藏
  • 首页
  • 热点
  • 知识
  • 时尚
  • 探索
  • 综合
  • 娱乐
  • 当前位置:首页 >风趣风 >面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    发布时间:2025-09-08 08:18:21 来源:观察爆料社- 每天分享精彩瞬间,乐享精彩时光 作者:热点

    [雷峰网(公众号:雷峰网)]两周前,面壁面壁发布领先的新模型早开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B,于L越发布时间更早,比肩综合性能相当,理超尤其是面壁苏州理工大学内幕价格拥有更强的推理性能——刷新开源大模型推理性能 SOTA,堪称开源大模型中「理科状元」。新模型早激活参数仅 39B,于L越支持 64k 上下文,比肩相比 Llama3 速度更快、理超可处理更长文本。面壁

    面壁新模型:早于Llama3、新模型早比肩 Llama3、于L越推理超越 Llama3!比肩

    图注:面壁Eurux-8x22B 模型在 LeetCode 和 TheoremQA这两个具有挑战性的基准测试中,刷新开源大模型推理性能 SOTA。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    图注:面壁Eurux-8x22B 模型综合性能比肩 LlaMa3-70B,超越开源模型 WizardLM-2-8x22b, Mistral-8x22b-Instruct,DeepSeek-67b,以及闭源模型 GPT-3.5-turbo。

     

    Eurux-8x22B 由 Mistral-8x22B对齐而来。强劲战斗力,来自面壁 Ultra 对齐工艺上新 UltraInterat 大规模、高质量对齐信息集。此前,面壁 Ultra 对齐系列信息集已经“强壮”了全球超 200 个大模型,堪称大模型上分神器。

     

    Eurux-8x22B模型+对齐信息集,全家桶开源:

    https://github.com/OpenBMB/Eurus

    https://huggingface.co/openbmb/Eurux-8x22b-nca

    开源大模型「理科状元」

    开源大模型「理科状元」

    复杂推理能力是体现大模型性能差异的最核心能力之一,也是大模型真正落地应用所需的关键能力所在。

    Eurux-8x22B 在代码和数学等复杂推理的综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA,堪称「理科状元」。特别在 LeetCode (180道LeetCode真题)和 TheoremQA(美国大学水准的STEM题目)这两个具有挑战性的基准测试中,超过现有开源模型。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    图注:Eurux-8x22B 在代码和数学等复杂推理综合性能方面超越 Llama3-70B,刷新开源大模型 SOTA。


    开源大模型「理科状元」Eurux-8x22B在实际应用中表现如何呢?


    在近期 LeetCode 周赛,这一检验人类程序员编程能力的真实竞技场上:Eurux-8x22B 在 Python 编程方面取得综合排名超越了80% 的人类参赛选手的优秀成绩,成功解决四道运算规则题中的三道,可以初步通过互联网大厂的程序员编程面试。


    下面是本次周赛中Eurux-8x22B对一道中等难度的运算规则题的真实解答:

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!


    除了代码能力优秀,Eurux-8x22B 解答数学题也是轻而易举。


    例如给它一道高中排列组合题,Eurux-8x22B 首先给出了清晰的解题思路,然后一步步地拆解执行,再进行结果汇总,最后得到正确答案。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    再考察它一道代数题,Eurux-8x22B 直击要害,运用二项式定理,清晰简洁地给出了正确的解答。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    接着给它一道向量代数题,Eurux-8x22B 也能轻松拿下。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    高考函数题可能是令很多人回忆起来就头疼的一类题,Eurux-8x22B 也能解答无误。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    (需要说明的是,Eurux-8x22B 没有针对中文语料进行额外的微调和对齐!)

    面壁 Ultra 对齐工艺,大模型上分神器!

    本次大模型「理科状元」 Eurux-8x22B 的优异表现,得益于来自面壁 Ultra 对齐工艺的大规模、高质量对齐信息集UltraInteract上新。

    好信息,才有好模型。此前,面壁 Ultra 对齐工艺已经“强壮”了全球超 200 个大模型,堪称大模型上分神器。

     ➤  UltraInterat对齐信息集地址:

    ? https://github.com/OpenBMB/Eurus

    UltraInteract是专门设计用于提升大模型推理能力的大规模、高质量的对齐信息集,包含了覆盖数学、代码和逻辑推理问题的12个开源信息集的86K条指令和220K偏好对,共有五十万(条)左右信息。相比而言,LLaMA 3-70B模型则是使用了千万量级的对齐信息,这从侧面证明了 UltraInteract 信息集的优质性——信息质量胜过信息数量。UltraInteract 信息集开源后在社区受到了广泛好评。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    从领先的端侧模型「小钢炮」MiniCPM,到开源模型推理新 SOTA 的Eurux-8x22B,为什么面壁智能总能推出同等参数、性能更优的「高效大模型」?答案是,大模型是一项系统工程,而面壁作为国内极少数兼具大模型运算规则与 infra 能力的团队,拥有自研的全流程高效生产线:面壁 Ultra 对齐工艺、Infra 工艺、独家「模型沙盒」实验和现代化信息工厂,从信息、训练到调校工艺环环相扣,一条优秀的大模型Scaling Law增长曲线由此而生。

    Infra工艺方面,面壁构建了全流程优化加速工具套件平台ModelForce,可以实现 10 倍推理加速,90% 成本降低。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    运算规则方面,通过上千次以上的「模型沙盒」实验,探索更加科学的训模方法。以小见大,寻找高效模型训练配置,实现模型能力快速形成。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    ➤  Eurux-8x22B模型GitHub地址:

    https://github.com/OpenBMB/Eurus

     ➤  Eurux-8x22B模型HuggingFace地址:https://huggingface.co/openbmb/Eurux-8x22b-nc

     ➤  UltraInterat对齐信息集地址:

    https://github.com/OpenBMB/Eurus





    雷峰网版权文章,未经授权禁止转载。详情见转载须知。

    面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!

    • 上一篇:见鬼了!虞书欣红毯艳压迪丽热巴?看见生图我笑了
    • 下一篇:阿里国际AI进展:日均调用量已破10亿次,获 WAIC 2025「SAIL之星」

      相关文章

      • 暂不回应停火方案 征召6万预备役 以色列还要对加沙做什么?
      • 宫廷美学遇上Lolita:花与珍珠匣×甄嬛传新品发布,打造梦想华服
      • 爱奇艺自制微剧《成何体统》6月28日上线,暑期档多部S级微剧蓄势待发
      • 闫勤温情演绎《爱上海军蓝》刘芳 7月2日腾讯视频、爱奇艺双平台首播 共鉴海军家庭的深海温情与坚守
      • 九三阅兵,具体安排来了!
      • 乌兰图雅唱响聊城非遗之夜 草原歌声激荡运河千年古韵
      • 2025年度电视剧(网络剧)精品创作编剧高级研修班正式结业
      • “寻找原汁原味老字号”活动启动,抖音生活服务持续助力老字号焕新
      • 中美俄战略三角,有新动向
      • 《五哈5》南北对抗火药味拉满!王祖蓝88米蹦极立十年之约,兄弟情深笑点连连

        随便看看

      • 突发!SASI全面开火!
      • 《睡美人》《胡桃夹子》《天鹅湖》“三颗钻石”同台 “老柴”经典倾倒津城观众
      • 李川张颜齐直播带货笑料频出! 姚尧再现春晚同款直播名场面!
      • 鱼你在一起曼谷首店引爆!POND明星效应+本土化营销打造中餐出海标杆
      • 俄副总理:俄方有向印度出口液化天然气的潜力
      • 与经典相逢,绘光影未来!“2025中国影视之夜”邀您赴约
      • 老铺黄金新加坡首店开业 中国高端黄金品牌出海
      • 电影《超人》启动#我身边的超人瞬间#线上征集
      • 波兰防长:东部发现的不明物体为俄军用无人机
      • 2025北京仲夏艺术季“多彩世界・创意中国”主题展启幕 多元艺术对话诠释文化多样性全球共识
      • Copyright © 2025 Powered by 面壁新模型:早于Llama3、比肩 Llama3、推理超越 Llama3!,观察爆料社- 每天分享精彩瞬间,乐享精彩时光  我要啦免费统计sitemap