返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 中科院计算所推出多语言大模…
 墨西哥4月汽车销量中国品牌牛…
 科大讯飞P20、P20Plus用后体…
 紧凑ATX中塔钢炮——几何未来…
 行业前沿|阿里版 ChatGPT 突…
 有必要等40系显卡的笔记本吗…
 这套配置搭什么显卡和显示器…
 41年大牌显卡厂商Sparkle投身…
 RTX 4060显卡价格上涨 入门型…
 csgovr版具体需要什么设备?…
 创联电源推出恒功率调光电源…
 全球微动态丨csgo哪里开箱 c…
 csgo在什么网站开箱?csgo不…
 新能源汽车测试之方案篇——…
 ATX电源是如何为工控电脑供电…
 小米笔记本蓝屏?别急也许只…
 2023电商半年报:他们曾经众…
 300万条学生个人信息被兜售 …
 电脑机械硬盘出现坏道怎么修…
 苹果电脑硬盘容量小怎么办?…
 惠普打印机郑州售后维修中心…
 超薄LED AOC超值23英寸液晶显…
 KYY推出两款笔记本电脑显示器…
 新华网重庆频道
 KYY推出新款三屏笔记本电脑显…
 显示器中的超级生产力 一个月…
 这个无显卡万人团配置问题大…
 机械革命 CODE01 笔记本电脑…
 消息称苹果可折叠屏笔记本电…
 大学生如何挑选笔记本电脑不…
 飞机可以带笔记本电脑吗?如…
 极速竞技 幻想空间 尔英板载…
 网络办公神器!一绳USB转RJ4…
 给老伙计升级一下固态有必要…
 洞悉未来崭新一页尔英科技首…
 华擎推出N100DC-ITX主板 采用…
 内存对齐的规则以及作用
 贝迪BMP21 PLUS手持式英文标…
 灵耀13 2023轻约1kg的32G 1T…
 芯瑞达:6月21日接受机构调研…
 轻薄长续航高颜值华硕灵耀13…
 数显式旋转粘度计报价
 高选购价值的RTX轻薄本怎么买…
 性能与轻薄的极致表现|雷蛇…
 要上大学了大家可以推荐下电…
 R7 5800H相当于I7几代 R7 58…
 【喜报】龙芯终于支持CH341 …
 深度观察丨筹办成都大运会:…
 笔记本电源的一些常见问题和…
 高青县:联想电脑频繁烧主板…
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑内存 >> 正文
高级搜索
中科院计算所推出多语言大模型“百聆”我们已经上手聊起来了
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/7/8 7:46:46 | 【字体:

  月魔传说如何用经济友好、内存节约的方式,来实现 LLM 生成能力和指令遵循能力的跨语言迁移?

  2023 年过半,ChatGPT、GPT-4、LLaMA 等大型语言模型(LLM)一次次引起人们高度关注,它们具备令人惊艳的涌现能力,包括语言理解能力、生成能力、知识推理能力等等。

  LLM 通常基于大规模语料训练知识表示与语言生成能力,随后在人工编写的指令数据上进行微调以实现与人类的意图对齐。因此,如何有效地进行指令微调使大型语言模型对齐人类偏好,对于模型的最终性能与用户体验至关重要。

  现有研究在预训练和指令微调阶段使用的数据大多仅围绕英文组成,语言的不平衡现象成为了制约模型能力以及交互体验的主要瓶颈。然而,将各个语言分别引入预训练以及指令微调阶段是昂贵且低效的。

  近期,中国科学院计算技术研究所冯洋研究员带领的自然语言处理团队针对这个问题探索了新的方案 —— 在指令微调阶段将英语与其他语言对齐,以交互式翻译任务为核心进行指令微调训练。

  基于所提方法,研究团队在中科南京信息高铁研究院的算力和工程开发团队支持下,在中科院计算所信息高铁 Al 训练推理平台 MLOps 上训练并发布了新的大型语言模型「百聆」,旨在让大型语言模型对齐人类意图的同时,将其生成能力和指令遵循能力从英语泛化到其他语种。「百聆」以经济友好、内存节约的方式实现了多语言人机交互能力。

  在交互式翻译任务中,研究团队通过一系列的交互向百聆提供涵盖中、英、德、法四门语言翻译相关的指令和约束条件,要求它必须在理解所有先前指令的基础上提供满足需求的反馈。借助于翻译任务的语义对齐特性,百聆能够实现生成能力在不同语言之间的迁移,并在交互式的过程中学习与人类意图进行对齐。

  基于百聆-7B 和百聆-13B 的相关实验结果表明:在单轮翻译任务上,百聆达到了 GPT-4 95% 的性能,在交互式翻译上,百聆达到了 GPT-3.5-turbo 96% 的性能。

  此外,研究团队还构建了双语多轮通用测试集 BayLing-80。在 BayLing-80 测试集上,百聆达到了 GPT-3.5-turbo 89% 的性能。在中文高考和英语标准化考试(SAT/GRE/GMAT等)任务上,百聆在众多大模型中位列第 2,仅次于 GPT-3.5-turbo。

  目前,研究团队已经开源了 7B 和 13B「百聆」模型权重以及 BayLing-80 双语多轮通用测试集,同时在中科南京信息高铁研究院的支撑下完成了「百聆」的线上部署,目前已经以邀请的方式开放内测。

  我们来看一下「百聆」在交互式翻译、知识问答、文案写作、逻辑推理、生成与解释代码、数学计算和角色扮演多个任务上的实际表现。

  衡量大语言模型跨语言对齐能力的一个重要标志是其完成翻译任务的水平。百聆模型以交互式翻译任务为核心进行了指令微调训练,因此百聆在翻译方面性能优异。

  例如,百聆可以将英文诗歌翻译成中文,语言优美,饱含感情,并且可以分析提炼诗歌的主旨大意:

  除了常规的翻译任务以外,百聆还支持用户通过额外的自然语言指令交互来约束或调整翻译结果。有些英文诗歌直译之后缺乏节奏感,用户可以让百聆模型修改翻译结果:

  大型语言模型备受关注的一个重要原因是它们展现出「了解知识」的能力,包括常识和复杂知识。首先,我们看下百聆对日常问题「如何确定一个人是真正对谈话感兴趣还是只是礼貌地说话」给出的答案:

  对于更复杂的问题「解释量子计算的基础」,百聆也能给出大致回答,并且在进一步提问「这种方式相比于传统计算的优势」时,百聆给出了条理清晰的答案,这也说明它具备多轮问答能力。

  作为语言模型,文本生成是百聆模型的一项基本能力,我们实际测试了百聆的应用文案写作水平,要求它为机器之心写一则招聘广告:

  另外,百聆还可以撰写简单的电子邮件,这类文案写作能力使百聆具备办公应用的潜力。

  在机器学习领域,逻辑推理是一项非常困难的任务。也正因为如此,大型语言模型表现出的推理能力才让人们印象深刻。

  我们发现百聆大模型具备逻辑推理能力。例如,面对问题:「一个典型的冬天会下多少雪花」,百聆模型给出了下雪的影响因素,并阐述了雪的形成原理,最后给出了估计下雪量的参考条件,强调要根据实际情况分析这个问题。

  当然,作为一个语言模型,逻辑推理的结果未必是完全正确的。如果我们要求百聆模型证明推理是正确的,它会诚实地回答道:「我的回答仅为一个估计,可以为读者提供一些参考,但不能保证准确性。」

  由于编程代码要求符合逻辑、严谨、可执行,因此生成代码对 LLM 来说也是一项非常有挑战性的任务。我们用「找出一组数中最大数」这个经典问题测试了百聆生成代码的能力,百聆生成的代码基本正确,并且还给出了这段代码的解释。

  编写完 C++ 代码后,我们还可以要求「百聆」将代码转换成 Python 语言:

  在数学计算方面,百聆使用「勾股定理」解决了一道「求线段长度」的数学问题:

  这道题目说明百聆掌握了基本的数学计算和公式方法,同时也能看出它会使用直角坐标系(线段端点的表示方式)。

  最后,我们来看一下百聆的「角色扮演」能力。以文学巨匠莎士比亚笔下的角色为例,我们发现百聆了解莎士比亚的写作风格:

  如果让百聆假装自己是一位世界著名厨师,向评委介绍菜品,它马上就进入状态了:

  这些测试样例表明百聆已经具备多方面的生成能力、理解能力和推理能力。值得注意的是,大部分测试的问题都是用中文描述和回答的,这说明百聆实现了生成能力在不同语言之间的迁移,并在交互的过程中学会了与人类意图进行对齐。

  为了对百聆的交互翻译能力做细致的定量评价,研究团队邀请了 5 位持有英语专业八级证书的专业人员对百聆以及其他基线系统在随机打乱顺序的情况下进行人工评测。通过统计各个模型在测试用例上排名第一的占比,研究团队发现百聆的交互翻译能力与其他开源大模型相比具有明显优势,13B 参数量的百聆在这一任务上的性能甚至能与 175B 参数量的 ChatGPT 相媲美。

  得益于百聆在中文能力方面的增强,百聆在涵盖九门科目的高考测试集上取得了第二名的成绩,仅次于 GPT-3.5-turbo。与其他专注于某种特定语言的大模型相比,百聆中英双语能力更加均衡。

  为了详细考察百聆在通用任务上的能力,研究团队构建并开源了中英双语多轮通用任务测试集:BayLing-80。在使用 GPT-4 为百聆-13B 与 GPT-3.5-turbo 的生成结果进行评价的设定下,百聆-13B 在多个方向上达到了媲美 GPT-3.5-turbo 的性能。另一方面,研究团队也注意到百聆在代码生成、数学问题等需要较强推理能力的任务上的表现有待提升。

  读者福利:机器之心获得了 10 个邀请码,让读者体验「百聆」模型。欢迎大家留言,今天 24 点前点赞最高的 10 个读者将获得。

  原标题:《中科院计算所推出多语言大模型「百聆」,我们已经上手聊起来了(10个邀请码)》

  本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

电脑内存录入:admin    责任编辑:admin 
  • 上一个电脑内存:

  • 下一个电脑内存: 没有了
  •  
     栏目文章
    普通电脑内存 中科院计算所推出多语言大模型“百聆”我们已… (07-08)
    普通电脑内存 墨西哥4月汽车销量中国品牌牛逼奇瑞刚杀进就打… (07-08)
    普通电脑内存 科大讯飞P20、P20Plus用后体验英语学习成绩提… (07-08)
    普通电脑内存 紧凑ATX中塔钢炮——几何未来 M4 装机展示 (07-08)
    普通电脑内存 行业前沿|阿里版 ChatGPT 突然官宣!我们用 … (07-08)
    普通电脑内存 内存对齐的规则以及作用 (07-07)
    普通电脑内存 贝迪BMP21 PLUS手持式英文标签打印机 (07-07)
    普通电脑内存 全球新消息丨怎么在bios里面设置内存频率 电脑… (07-07)
    普通电脑内存 性能媲美Z790还能支持DDR5 8000内存!高性价比… (07-07)
    普通电脑内存 威刚推出XPG龙耀LANCER ROG认证内存 搭配双支… (07-07)
    普通电脑内存 科蓝软件(300663SZ):公司分布式事务型数据库… (07-07)
    普通电脑内存 MIT韩松创业两年被英伟达收购3位联创都是清华… (07-07)
    普通电脑内存 长虹CHiQ二代 (07-06)
    普通电脑内存 内存中有一小部分用来存储系统的基本信息CPU对… (07-06)
    普通电脑内存 组装电脑基础知识之内存条(笔记本内存条组装) (07-06)
    普通电脑内存 投影仪系统内存有多大在哪里 (07-06)
    普通电脑内存 app2sd功能是什么意思 怎么设置app2sd功能 (07-06)
    普通电脑内存 市面上较为知名有信誉的CSGO开箱网站是哪些?… (07-06)
    普通电脑内存 电脑内存怎么选?应用测试解锁16GB和32GB有多… (07-06)
    普通电脑内存 安全可信的开箱子csgo网站介绍是什么?csgo电… (07-06)