消费级显卡可用！李开复零一万物发布并开源90亿参数Yi模型代码数学能力史上最强

返回首页　

设为首页　

加入收藏　

今天是:

网站首页电脑主板电脑cpu 电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修

消费级显卡可用！李开复零一…
马斯克跌落全球首富宝座；新…
台式电脑的电源是什么它的主…
台式机电脑电源供电不足怎么…
中国长城：长城电源涵盖服务…
电脑上的硬盘灯一直狂闪的具…
三星990 EVO 2TB固态硬盘上手…
库克称赞M3 MacBook Air是完…
昆明戴尔笔记本售后服务网点…
戴尔笔记本售后客服电线小时…
dell笔记本电脑维修的基本判…
海口发布十宗“3·15”消费维…
中国PC三巨头分销渠道之比较
特供药从9元到40元厂家公开…
硬核性能强势出击 OMEN暗影精…
大橘为重——Colorfire MEOW…
2024款苹果MacBook Air笔记本…
显示器预测：21：9针对性强 …
传音在MWC展示可卷曲手机原型…
电脑显示器无边框-电脑显示器…
稳定可靠比看书还安静的商用…
千元价位段纯白装机之选技嘉…
寻找最佳的M2接口？来看看这…
Xbox Series X细节：NVMe SS…
超能课堂(275)：从10变成10W…
基于华为openEuler的《操作系…
亚马逊售出假冒RTX 4090显卡…
何时降息？美联储主席鲍威尔…
NVIDIA 亮相亚马逊云科技中国…
电脑硬件教程
七彩虹隐星P15 24评测：颜值…
ops电脑有什么用？有什么注意…
tp钱包官网下载app苹果(垃圾…
电脑磁盘突然不见了怎么办电…
平板电脑硬盘在哪里位置主板…
延时服务暖人心上门维修显真…
华硕a豆品牌升级全新AI超轻…
十堰各地各部门开展“学雷锋…
宏辉果蔬：公司的销售模式分…
农村产品销售渠道
会展那些事儿｜如何进行展会…
2024年全球顶级硬件性能天梯…
英伟达炸裂发布最便宜GPUAI性…
笔记本电脑cpu排行榜2021笔记…
超声电子（000823）2月20日主…
极致超薄影音娱乐神器唯一A…
天马15寸工业液晶屏工控屏原…
ddr6的显卡ddr5主板能用吗
集特智能飞腾D2000全国产化主…
科普：计算机硬件设备显卡（…

专题栏目

您现在的位置：电脑评测网 >> 电脑显卡 >> 正文

高级搜索

消费级显卡可用！李开复零一万物发布并开源90亿参数Yi模型代码数学能力史上最强

作者：佚名文章来源：本站原创点击数：更新时间：2024/3/9 4:45:31 | 【字体：小大】

　　贾继海这两者都是在3.1T token中英文数据上进行的预训练，Yi-9B则在此基础上，增加了0.8T token继续训练而成。

　　开头提到，Yi-9B最大的进步在于数学和代码，那么这俩能力究竟如何提升呢？

　　靠的是先增加模型大小，在Yi-6B的基础上增至9B，再进行多阶段数据增量训练。

　　Yi-6B训练得已经很充分，再怎么新增更多token练效果可能也不会往上了，所以考虑扩增它的大小。(下图单位不是TB而是B)

　　对原模型进行宽度扩增会带来更多的性能损失，通过选择合适的layer对模型进行深度扩增后，新增layer的input/output cosine 越接近1.0，即扩增后的模型性能越能保持原有模型的性能，模型性能损失微弱。

　　依照此思路，零一万物选择复制Yi-6B相对靠后的16层（12-28 层)，组成了48层的Yi-9B。

　　实验显示，这种方法比用Solar-10.7B模型复制中间的16层（8-24层）性能更优。

　　然后增加另外的0.4T数据，同样包括文本和代码，但重点增加代码和数学数据的比例。

　　（悟了，就和我们在大模型提问里的诀窍“think step by step”思路一样）

　　即从固定的学习率开始，每当模型loss停止下降时就增加batch size，使其下降不中断，让模型学习得更加充分。

　　实测中，零一万物使用greedy decoding的生成方式（即每次选择概率值最大的单词）来进行测试。

　　（两者命名准则不一样，前者只用了Non-Embedding参数，后者用的是全部参数量并向上取整）

电脑显卡录入：admin 责任编辑：admin
	上一个电脑显卡：马斯克跌落全球首富宝座；新 MacBook Air 发售搭载 M3 芯片；简体中文成 Steam 最常用语言下一个电脑显卡：没有了

　栏目文章

消费级显卡可用！李开复零一万物发布并开源90… (03-09)	马斯克跌落全球首富宝座；新 MacBook Air 发售… (03-09)
亚马逊售出假冒RTX 4090显卡安装的是RTX 408… (03-08)	何时降息？美联储主席鲍威尔即将发声！ (03-08)
NVIDIA 亮相亚马逊云科技中国峰会欢迎聆听技术… (03-08)	显卡是用来干嘛的 (03-07)
技嘉GA-Z77P-D3支持什么显卡标准 (03-07)	性能不是一切! 细数显卡特色功能和应用 (03-07)
【行业观察】手机公司的卫星竞赛 (03-06)	看NVIDIA显卡发展史是如何蜕变成“人工智能”… (03-06)
手机公司的卫星竞赛 (03-06)	外置显卡怎么使用 (03-05)
外置显卡和内置显卡的区别 (03-05)	《地狱之刃2》配置要求出炉：最低要求需960显… (03-05)
MWC 2024观察：AI+硬件元年来了 (03-04)	显卡天梯图2024 (03-04)
天钡推出 GEM12 迷你主机：R7-7840HS可选配副… (03-04)	4K高阶游戏性能！华硕TUF GAMING 4080 SUPER超… (03-03)
联想GeekPro电脑主机上新：14代酷睿+RTX40系显… (03-03)	如何看电脑显卡好坏电脑显卡好坏分辨方法【详… (03-03)

	设为首页加入收藏联系站长友情链接版权申明网站公告管理登录
	电脑评测网声明：登载内容出于传递信息之目的，绝不意味着赞同其观点或证实其描述，若侵权请来信告知，我们将及时处理！