返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 阿联酋开源“最快推理模型”…
 全天候电脑维修服务:24小时…
 电脑维修专家热线专业解决电…
 怎样修改局域网内部打印机的…
 常年批发出售回收二手笔记本…
 今年以来内蒙古落实“五大任…
 山西二手笔记本
 机械硬盘(机械硬盘是什么)
 硬盘在主机箱的哪个位置?
 瓦伦西亚前锋:到现在还不知…
 英伟达发布58129版显卡驱动为…
 曝英伟达推迟RTX 50 SUPER系…
 英伟达重大发布!
 “中国智造为海外消费者提供…
 【工作动态】鄂尔多斯市首家…
 台式机电源怎么测试电源好坏
 股票行情快报:超声电子(00…
 i3加HD7850整机仅3K2
 超声电子涨248%成交额343亿元…
 AMD出千元高性价比游戏神U 锐…
 电脑健康也能AI“算命”?腾…
 苹果 : iPhone“小打小闹”…
 电脑网线在哪里
 不到千元的迷你办公主机!台…
 甘肃国信取得计算机主机结构…
 thumbnails是什么文件夹 thu…
 比亚迪byd英文含义
 风行系统需求是什么
 技术驱动生态进化:星恒电源…
 品质家具白牌价!京东京喜自…
 京东先人一步首发联想至像M3…
 本田12日将发售新款微型EV并…
 iPhone 17 配件风波:TELESI…
 desktop是什么
 是时候给QLC一些机会了!这款…
 神舟战神Z8为何能文武双全
 法治护航让百姓舒心企业安心
 真白真香型主机该装啥显卡看…
 GeForce GTX 16
 NVIDIA Geforce GTX 1060 3G…
 【2025年9月】9月装机走向与…
 2025年十五运会广东赛区持票…
 刚装的PC:开机使用突然爆炸…
 超薄电视挂架显示器支架壁挂…
 挂超薄液晶显示屏
 电脑壁挂显示器-电脑壁挂显示…
 笔记本cpu温度高怎么回事 笔…
 国产处理器
 x86强势回归!AMD自信:Arm架…
 技嘉B860I AORUS PRO ICE DD…
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑内存 >> 正文
高级搜索
阿联酋开源“最快推理模型”撞名Kimi基于阿里Qwen用上全球最大芯片
作者:佚名 文章来源:本站原创 点击数: 更新时间:2025/9/12 18:11:54 | 【字体:

  于咏琳透视奶照智东西9月10日消息,今日上午,阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合AI创企G42推出的新低成本推理模型K2 Think,相关论文已arXiv预印本平台发表,昨天下午模型在Hugging Face、GitHub上开源。

  K2 Think有320亿个参数,基于阿里巴巴的开源模型Qwen 2.5构建,性能超过参数规模是其20倍的OpenAI和DeepSeek旗舰推理模型。

  技术报告中,研究人员提到K2 Think背后有六大技术创新协同,研究人员通过监督微调扩展基础模型的思维链能力,然后通过可验证奖励强化学习(RLVR)增强推理性能、利用推理时间技术增强模型,最后在部署K2-Think时进行两项速度优化,包括推测解码和Cerebras的晶圆级芯片,同时使用公开可用的开源数据集训练。

  K2-Think背后有两大强力推手:一方是穆罕默德・本・扎耶德人工智能大学(MBZUAI),这是阿拉伯联合酋长国专门设立、聚焦AI研究的机构;另一方是阿布扎比支持的科技集团G42,不仅在2024年拿到微软15亿美元投资,还在阿联酋建造OpenAI、软银等企业联合投资的AI基建 “星际之门”。

  该模型的权重、训练数据、部署代码和测试时优化代码已经在Hugging Face、GitHub上开源。

  一、数学性能领先OpenAI、DeepSeek旗下开源模型,要为数学、科学提供特定用途服务

  MBZUAI校长兼首席AI研究员Eric Xing在接受外媒WIRED采访时透露,K2 Think是使用数千个GPU开发的,最终的训练过程涉及200到300块芯片。

  K2 Think并非一个完整的大语言模型,是专门用于推理的模型,能够通过模拟推理方式来回答复杂问题,而不是快速综合信息来提供信息输出,Xing提到,他们在未来几个月将K2 Think整合到一个完整的大模型中。

  在用于评估大模型将复杂科学问题转化为可执行代码能力的SciCode基准测试中,K2-Think获得39.2分排名第二,与第一名的Qwen3 235BA22B仅有0.1分之差。

  MBZUAI基础模型研究所所长Hector Liu提到,K2-Think的特别之处在于,他们将其视为一个系统,他们的目标不是构建类似ChatGPT的聊天机器人,而是为数学和科学等领域的特定用途提供服务。

  K2-Think的技术报告显示,其背后有六大技术创新,包括思维链监督微调、可验证奖励强化学习(RLVR)、推理前的Agent规划、测试时扩展、推测解码和推理优化硬件、仅使用公开可用的开源数据集训练。

  基于这种系统化的技术创新,K2-Think通过长链式思维监督微调增强了逻辑深度、可验证奖励的强化学习提高了解决难题的准确率、Agent式规划使模型能够在推理前分解复杂挑战、测试时扩展技术进一步提升了模型的适应性,最终实现性能对标更大参数规模模型。这使得模型能够提供强大的思维链推理能力和近乎即时的响应时间。

  在监督微调阶段,K2-Think使用思维链对基础模型进行监督微调。研究人员采用了现有的AM-Thinking-v1-Distilled数据集,该数据集由CoT推理痕迹和指令/响应对组成,提示来自数学推理、代码生成、科学推理、指令遵循和一般聊天等任务。他们评估发现,SFT模型在各个采样预算下均优于基础模型。

  在可验证奖励强化学习阶段,可验证奖励强化学习通过直接优化模型生成的正确性,降低了基于人类反馈强化学习(RLHF)基于偏好对齐的复杂性和成本。因此研究人员使用了Guru数据集,该数据集包含数学、编程、科学、逻辑、模拟和表格六个领域任务、近92000个可验证问题。

  在测试时间改进阶段,为了进一步提升模型性能,研究人员开发了测试时框架,为训练后的推理模型提供结构化输入,包括推理前的Agent规划,即“先计划后思考”,以及使用Best-of-N采样的测试时扩展。

  从输入到最终响应时,模型会重构提示以概述总体规划、突出相关概念。然后这一增强的提示将通过K2-Think模型生成多个响应,最后对候选响应进行两两比较,最终选出最佳生成结果作为推理系统的最终输出。

  第四阶段是部署,在具有挑战性的数学证明或多步骤编码问题中,一个典型复杂推理任务一般会生成32000个token的响应。在NVIDIA H100上,这可以在不到3分钟的时间内完成,在WSE上,同样32000个token的生成任务只需16秒。

  这是因为GPU必须在每个token生成时不断将权重从高带宽内存传输到GPU核心,而WSE将所有模型权重存储在海量片上内存中,充分利用每秒25PB的片上内存带宽,比最新NVIDIA B200 GPU提供的0.008PB/s高出3000多倍。

  K2-Think模型的性能证明,320亿参数规模的模型经过后期训练,能够生成较长的推理思路链,并结合相对较少的测试时间计算,可以实现小模型与参数数量级更大的模型相媲美的能力。

  MBZUAI基础模型研究所的总经理Richard Morton认为,人脑的基本推理是所有思维过程的基础,K2-Think的应用,可以缩短研究人员思考特定任务、进行临床试验的时间,从而将先进的AI技术扩大到AI基础设施稀缺的地区。

电脑内存录入:admin    责任编辑:admin 
  • 上一个电脑内存:

  • 下一个电脑内存: 没有了
  •  
     栏目文章
    普通电脑内存 阿联酋开源“最快推理模型”撞名Kimi基于阿里… (09-12)
    普通电脑内存 thumbnails是什么文件夹 thumbnails文件夹有哪… (09-11)
    普通电脑内存 比亚迪byd英文含义 (09-11)
    普通电脑内存 风行系统需求是什么 (09-11)
    普通电脑内存 iPhone 17系列新增内存安全链:阻止间谍软件攻… (09-10)
    普通电脑内存 朗科科技:目前公司主要产品有SSD固态硬盘、D… (09-10)
    普通电脑内存 磁阻内存最新资讯-快科技--科技改变未来 (09-10)
    普通电脑内存 网易uu网游加速器 v4582免费版 (09-09)
    普通电脑内存 世隆科技:地质雷达常见故障分析及解决方案探… (09-09)
    普通电脑内存 人才纪录片热播让韩国反思“学医痴迷” (09-09)
    普通电脑内存 什么是电脑内存条?内存条有什么作用?如何挑… (09-08)
    普通电脑内存 32G内存能跑30B大模型!英特尔发布可变显存技… (09-08)
    普通电脑内存 我们通常说的内存条指的是 ( ) (09-08)
    普通电脑内存 2024年09月29日B (09-07)
    普通电脑内存 做运动视频扑克视频网站 MBA智库 (09-07)
    普通电脑内存 AI重磅!华为“黑科技”来了 (09-07)
    普通电脑内存 《无人深空》刷S级异星飞船技巧-无人深空刷S级… (09-06)
    普通电脑内存 bios设置为出厂默认 两种方法轻松解决 (09-06)
    普通电脑内存 联想电脑怎么进入bios 联想进入bios方法 (09-06)
    普通电脑内存 中华人民共和国监察法实施条例 (09-05)