返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 消费级显卡可用!李开复零一…
 马斯克跌落全球首富宝座;新…
 台式电脑的电源是什么它的主…
 台式机电脑电源供电不足怎么…
 中国长城:长城电源涵盖服务…
 电脑上的硬盘灯一直狂闪的具…
 三星990 EVO 2TB固态硬盘上手…
 库克称赞M3 MacBook Air是完…
 昆明戴尔笔记本售后服务网点…
 戴尔笔记本售后客服电线小时…
 dell笔记本电脑维修的基本判…
 海口发布十宗“3·15”消费维…
 中国PC三巨头分销渠道之比较
 特供药从9元到40元 厂家公开…
 硬核性能强势出击 OMEN暗影精…
 大橘为重——Colorfire MEOW…
 2024款苹果MacBook Air笔记本…
 显示器预测:21:9针对性强 …
 传音在MWC展示可卷曲手机原型…
 电脑显示器无边框-电脑显示器…
 稳定可靠比看书还安静的商用…
 千元价位段纯白装机之选 技嘉…
 寻找最佳的M2接口?来看看这…
 Xbox Series X细节:NVMe SS…
 超能课堂(275):从10变成10W…
 基于华为openEuler的《操作系…
 亚马逊售出假冒RTX 4090显卡…
 何时降息?美联储主席鲍威尔…
 NVIDIA 亮相亚马逊云科技中国…
 电脑硬件教程
 七彩虹隐星P15 24评测:颜值…
 ops电脑有什么用?有什么注意…
 tp钱包官网下载app苹果(垃圾…
 电脑磁盘突然不见了怎么办 电…
 平板电脑硬盘在哪里位置 主板…
 延时服务暖人心上门维修显真…
 华硕a豆品牌升级 全新AI超轻…
 十堰各地各部门开展“学雷锋…
 宏辉果蔬:公司的销售模式分…
 农村产品销售渠道
 会展那些事儿|如何进行展会…
 2024年全球顶级硬件性能天梯…
 英伟达炸裂发布最便宜GPUAI性…
 笔记本电脑cpu排行榜2021笔记…
 超声电子(000823)2月20日主…
 极致超薄影音娱乐神器 唯一A…
 天马15寸工业液晶屏工控屏原…
 ddr6的显卡ddr5主板能用吗
 集特智能飞腾D2000全国产化主…
 科普:计算机硬件设备 显卡(…
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑显卡 >> 正文
高级搜索
消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型 代码数学能力史上最强
作者:佚名 文章来源:本站原创 点击数: 更新时间:2024/3/9 4:45:31 | 【字体:

  贾继海这两者都是在3.1T token中英文数据上进行的预训练,Yi-9B则在此基础上,增加了0.8T token继续训练而成。

  开头提到,Yi-9B最大的进步在于数学和代码,那么这俩能力究竟如何提升呢?

  靠的是先增加模型大小,在Yi-6B的基础上增至9B,再进行多阶段数据增量训练。

  Yi-6B训练得已经很充分,再怎么新增更多token练效果可能也不会往上了,所以考虑扩增它的大小。(下图单位不是TB而是B)

  对原模型进行宽度扩增会带来更多的性能损失,通过选择合适的layer对模型进行深度扩增后,新增layer的input/output cosine 越接近1.0,即扩增后的模型性能越能保持原有模型的性能,模型性能损失微弱。

  依照此思路,零一万物选择复制Yi-6B相对靠后的16层(12-28 层),组成了48层的Yi-9B。

  实验显示,这种方法比用Solar-10.7B模型复制中间的16层(8-24层)性能更优。

  然后增加另外的0.4T数据,同样包括文本和代码,但重点增加代码和数学数据的比例。

  (悟了,就和我们在大模型提问里的诀窍“think step by step”思路一样)

  即从固定的学习率开始,每当模型loss停止下降时就增加batch size,使其下降不中断,让模型学习得更加充分。

  实测中,零一万物使用greedy decoding的生成方式(即每次选择概率值最大的单词)来进行测试。

  (两者命名准则不一样,前者只用了Non-Embedding参数,后者用的是全部参数量并向上取整)

电脑显卡录入:admin    责任编辑:admin 
  • 上一个电脑显卡:

  • 下一个电脑显卡: 没有了
  •  
     栏目文章
    普通电脑显卡 消费级显卡可用!李开复零一万物发布并开源90… (03-09)
    普通电脑显卡 马斯克跌落全球首富宝座;新 MacBook Air 发售… (03-09)
    普通电脑显卡 亚马逊售出假冒RTX 4090显卡 安装的是RTX 408… (03-08)
    普通电脑显卡 何时降息?美联储主席鲍威尔即将发声! (03-08)
    普通电脑显卡 NVIDIA 亮相亚马逊云科技中国峰会欢迎聆听技术… (03-08)
    普通电脑显卡 显卡是用来干嘛的 (03-07)
    普通电脑显卡 技嘉GA-Z77P-D3支持什么显卡标准 (03-07)
    普通电脑显卡 性能不是一切! 细数显卡特色功能和应用 (03-07)
    普通电脑显卡 【行业观察】手机公司的卫星竞赛 (03-06)
    普通电脑显卡 看NVIDIA显卡发展史是如何蜕变成“人工智能”… (03-06)
    普通电脑显卡 手机公司的卫星竞赛 (03-06)
    普通电脑显卡 外置显卡怎么使用 (03-05)
    普通电脑显卡 外置显卡和内置显卡的区别 (03-05)
    普通电脑显卡 《地狱之刃2》配置要求出炉:最低要求需960显… (03-05)
    普通电脑显卡 MWC 2024观察:AI+硬件元年来了 (03-04)
    普通电脑显卡 显卡天梯图2024 (03-04)
    普通电脑显卡 天钡推出 GEM12 迷你主机:R7-7840HS可选配副… (03-04)
    普通电脑显卡 4K高阶游戏性能!华硕TUF GAMING 4080 SUPER超… (03-03)
    普通电脑显卡 联想GeekPro电脑主机上新:14代酷睿+RTX40系显… (03-03)
    普通电脑显卡 如何看电脑显卡好坏 电脑显卡好坏分辨方法【详… (03-03)