返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 百川智能发布Baichuan-13B开…
 机构研选 AI需求大增+技术变…
 参数量再加大百川智能发布13…
 亚马逊和英伟达也卷入“反性…
 优派爆款24吋Fast IPS电竞1m…
 轻薄移动办公利器 华硕灵耀1…
 优派爆款24吋Fast IPS电竞1m…
 2600nit超高亮屏硕腾HUGEROC…
 每天对着电脑十个小时如何科…
 Win11 23H2年度更新确认:四…
 优化风道是电脑散热的关键 风…
 14秒!中国人自己的CPU+操作…
 三款主流跑分软件对比:就CP…
 cpu散热器上的几根线分别是什…
 一文看懂显示器所有指标参数…
 笔记本电脑为什么要另外买显…
 不太懂装机近期想配一台电脑…
 55寸防爆电视防爆显示器电脑…
 北斗系统总设计师杨长风:北…
 一季度IPO过会率八成
 今日关注]从金融业年报内容看…
 遭泥石流反复“洗劫”的汶川…
 “在这里工作家人为我感到骄…
 内存条的作用
 dram是内存条吗
 DDR5
 微机中的内存条指的是什么
 数码专业网站头条PK - 网易数…
 显卡有什么作用
 什么是显卡干什么用的?
 显卡有啥用
 涨姿势:游戏之外的世界 专业…
 显卡的作用小编教你显卡的作…
 小米Redmi电竞显示器 G27 高…
 专为设计师研制的电脑显示器…
 小米Redmi电竞显示器 G27 高…
 术语繁多数码小白如何选购显…
 什么品牌的显示器最好
 【天天报资讯】电脑CPU温度过…
 电子技术应用业界新闻-电子发…
 电脑cpu温度过高怎么解决_电…
 炎炎夏日给电脑降温!GPU酷暑…
 cpu温度高怎么办?解决cpu温…
 紫光国微
 中国有没有芯片制造公司
 云涌科技获30家机构调研:公…
 1度电等于多少瓦 1度电等于多…
 AMD发布为16英寸MacBook Pro…
 NEWQ移动硬盘究竟赢在哪里?
 还在纠结硬盘分区?大容量SS…
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑显卡 >> 正文
高级搜索
百川智能发布Baichuan-13B开启中国开源大模型商业化时代
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/7/16 7:33:31 | 【字体:

  炫舞欲盖弥彰未来大模型生态开源闭源并存已经是不争的事实,如同iOS与安卓。目前,以GPT-4为代表的超大参数量闭源模型和100亿-200亿参数量开源模型是大模型生态链中两个最佳实践。

  GPT-4固然能力强大,但闭源会要求企业访问公网以及难以定制化适配,使用场景受限。而开源能够使企业轻松地借助专有数据进行微调和私有化部署,进而促进百行千业的良性发展生态。

  Baichuan-13B中英文大模型集高性能、完全开源、免费可商用等诸多优势于一身,是目前所有33B以下尺寸开源模型中效果最好的可商用大语言模型。

  在国外已建立起闭源及开源大模型完整生态的背景下,弥补了国内高品质开源商业模型的不足,对助力中国大模型产业发展和技术进步都具有重要意义。

  这是百川智能发布的第二款通用大语言模型,而在前不久的6月15日,百川智能就已经推出了首款70亿参数量的中英文语言模型Baichuan-7B,并一举拿下多个世界权威Benchmark榜单同量级测试榜首。

  预训练模型“底座”因其灵活的可定制性,适合具有一定开发能力的开发者和企业,而普通用户则更关注具有对话功能的对齐模型。因此百川智能在发布预训练模型Baichuan-13B-Base的同时还发布了其对话模型Baichuan-13B-Chat,Baichuan-13B-Chat部署简单、开箱即用,极大降低了开发者的体验成本。

  相比此前发布的Baichuan-7B,Baichuan-13B在1.4万亿token数据集上训练,超过LLaMA-13B 40%,是当前开源13B尺寸下训练数据量最大的模型,在语言模型中,上下文窗口长度对于理解和生成与特定上下文相关的文本至关重要。

  Baichuan-13B上下文窗口长度为4096,不同于Baichuan-7B的RoPE编码方式,Baichuan-13B使用了ALiBi位置编码技术,能够处理长上下文窗口,甚至可以推断超出训练期间读取数据的上下文长度,从而能够更好的捕捉文本中上下文的相关性,做出更准确的预测或生成。

  作为一款中英文双语大模型,Baichuan-13B采用了相对平衡的中英文语料配比和多语言对齐语料,从而在中英两种语言上表现均很优异。在同等参数量的开源模型中堪称实力担当,能更好满足商业化场景需求。

  中文领域,在权威评测C-EVAL中,Baichuan-13B性能一骑绝尘,在自然科学、医学、艺术、数学等领域大幅领先LLaMA-13B、Vicuna-13B等同尺寸的大语言模型,在社会科学、人文科学等领域甚至超越了ChatGPT。

  英文领域,其表现同样优秀,在英文最权威的榜单MMLU上,Baichuan-13B超过了所有同尺寸开源模型,并且在各个维度都具有显著优势。

  必须要说的是,有些模型为了能在评测中取得更好的成绩,会在基座模型和对话模型上引入较多针对benchmark的优化。此举虽然可以在榜单上获取更高的分数,但是没有本质地提升模型的基础能力,并且在下游任务中易产生回复长度短、质量低的问题,造成高分低能的现象。

  众所周知大模型的训练成本极高,在海量算力的成本压力下OpenAI和谷歌都选择了闭源来保证自家大模型的优势地位。但是从计算机科学与人工智能的发展历程来看,开源始终对软件技术乃至IT技术发展有着巨大的推动作用。

  大模型时代,Meta率先走上了开源的道路,LLaMA基座开源之后因其出色的性能,迅速吸引了大量开发者。在其基础上开发了各种ChatGPT开源替代品,并且以极低的训练成本屡次达到匹敌GPT-3.5的性能,极大激发了开源模型的创新活力。

  未来大模型生态闭源与开源并存已是行业共识。凭借闭源路线以及开源路线的LLaMA,美国在大模型领域已经构建起了完整的生态。

  尽管中文世界不乏优秀的开发者、出色的创新能力和广泛的应用场景,但由于缺少高性能和高定制性的开源基座模型,在大语言模型领域的相关研究和应用上仍存在较大的挑战。中国急需优质开源可商用大模型补齐相关领域的空白,与开发者和企业共同推动中国人工智能应用的创新生态发展。

  作为同级最好的开源可商用中英文预训练语言模型,Baichuan-13B-Base 不仅对学术研究完全开放,所有开发者均可通过邮件向百川智能申请授权,在获得官方商用许可后即可免费商用。

  并且,为了尽可能降低模型的使用门槛,百川智能同时开源了Baichuan-13B-Chat的INT8和INT4两个量化版本,在近乎无损的情况下可以很方便的将模型部署在如3090等消费级显卡上。

  本次百川智能发布的Baichuan-13B中英文大语言模型,凭借百亿参数量已经展现出可以媲美千亿模型的能力,大大降低企业部署和调试的使用成本,让中国开源大模型商业化进入真正可用阶段。Baichuan-13B的开源,实现了国内开源大模型对美国大模型开源领域的追赶,改变了此前国内在相关领域一直落后的局面。

  同时,其开源模型的代码完全公开,所有人都可以随时查看,算法透明,不仅有利于研究人员深入探索和研究模型原理,并且有利于建立和深化公众对大模型的信任。

电脑显卡录入:admin    责任编辑:admin 
  • 上一个电脑显卡:

  • 下一个电脑显卡: 没有了
  •  
     栏目文章
    普通电脑显卡 百川智能发布Baichuan-13B开启中国开源大模型… (07-16)
    普通电脑显卡 机构研选 AI需求大增+技术变革双驱动!芯片行… (07-16)
    普通电脑显卡 参数量再加大百川智能发布13B中英文大模型开源… (07-16)
    普通电脑显卡 亚马逊和英伟达也卷入“反性骚扰运动”150多人… (07-16)
    普通电脑显卡 显卡有什么作用 (07-15)
    普通电脑显卡 什么是显卡干什么用的? (07-15)
    普通电脑显卡 显卡有啥用 (07-15)
    普通电脑显卡 涨姿势:游戏之外的世界 专业显卡都有哪些用途… (07-15)
    普通电脑显卡 显卡的作用小编教你显卡的作用是什么 (07-15)
    普通电脑显卡 日本厂商玄人志向推出英特尔 A750 显卡:蓝色… (07-15)
    普通电脑显卡 宏碁发布首款AMD显卡RX 7600 售价8490新台币 (07-15)
    普通电脑显卡 频率飙至4230MHz!RTX 4090显卡超频纪录再次刷… (07-15)
    普通电脑显卡 40系显卡上市时间表和官方售价是多少 玩吃鸡怎… (07-15)
    普通电脑显卡 索泰推出 RTX 4070 Ti TRINITY OC 显卡月白色… (07-15)
    普通电脑显卡 黄仁勋苏姿丰是亲戚 苏妈要喊黄仁勋表舅 (07-14)
    普通电脑显卡 频繁烧毁太无语!英伟达悄悄改变RTX 4090公版… (07-14)
    普通电脑显卡 快来了?英特尔DG2独立显卡实物照持续曝光 (07-14)
    普通电脑显卡 NVIDIA Studio加速改善创意工作流 华硕ProArt… (07-14)
    普通电脑显卡 AMD RX 6000系列显卡长这样 官方图片来了 (07-14)
    普通电脑显卡 最新显卡天梯图2020 年5月显卡天梯图排行榜 (07-14)