返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 笔记本就能运行的ChatGPT平替…
 松下笔记本火了?这价格你接…
 搭载英伟达RTX4060显卡 微软…
 挖矿到底伤显卡什么?
 ChatGPT带火NVIDIA显卡 顶级…
 全球游戏玩家37亿PC+主机用户…
 RTX 4090卡成幻灯片路径追踪…
 电脑电源功率计算公式
 电脑电源功耗的计算方法
 网友要求测算电脑电源变压器…
 最标准的电脑电源功率计算公…
 电脑电源计算公式?
 1TB 799元!长江存储致钛SC0…
 极致性能 全铝外壳 西部数据…
 国产固态硬盘迎来白菜价:长…
 要给你家的硬盘挪一个窝 超1…
 狂飙7GBs!浦科特M10P固态硬…
 华北售后京东维修通四海日升…
 京东国际物流首个海外维修中…
 京东维修上线供免费取送、原…
 3C产品买、修、换一站式全搞…
 崩溃阿!京东物流修2天拿6、…
 贺岭:走在希望的田野上
 欢乐家获284家机构调研:公司…
 2023年财运最旺的星座收入越…
 分享中设西瓜树元引擎视播方…
 精彩纷呈!大华·丰视2023IS…
 三星将向法拉利供OLED
 江西百亿学霸梦碎折叠屏苦等…
 安兔兔“十大次旗舰”手机性…
 2022新款奔驰V级钜惠48万元 …
 完全自主研发架构无需国外授…
 笔记本电脑CPU怎么选?Intel…
 真国产自主!龙芯CPU布局与未…
 笔记本CPU和台式CPU有什么区…
 AMD锐龙7000笔记本巧用橙色贴…
 DIY电脑基础知识电脑组装机配…
 主板上的接口有多少分别有什…
 教你认识主板上的主要芯片
 电脑主板知识:主板板型、接…
 求科普电脑硬件知识就是接口…
 如何确定工业主板是否优质
 谷歌正改进Chrome以减少win1…
 江波龙亮相CES 2023 从科技趋…
 激发存储无限潜力 Solidigm持…
 性能如何?我们一测便知
 挖以太坊用什么配置_以太坊G…
 显卡驱动是干什么的
 RTX 4060显卡功耗是多少 显卡…
 显卡是什么?干什么用的?
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑内存 >> 正文
高级搜索
笔记本就能运行的ChatGPT平替来了附完整版技术报告
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/4/13 2:20:04 | 【字体:

  中文网小说GPT4All 是基于大量干净的助手数据(包括代码、故事和对话)训练而成的聊天机器人,数据包括~800k 条 GPT-3.5-Turbo 生成数据,基于 LLaMa 完成,M1 Mac、Windows 等环境都能运行。或许就像它的名字所暗示的那样,人人都能用上个人 GPT 的时代已经来了。

  自从 OpenAI 发布 ChatGPT 后,最近几个月聊天机器人热度不减。

  虽然 ChatGPT 功能强大,但 OpenAI 几乎不可能将其开源。不少人都在做开源方面的努力,比如前段时间 Meta 开源的 LLaMA。其是一系列模型的总称,参数量从 70 亿到 650 亿不等,其中,130 亿参数的 LLaMA 模型「在大多数基准上」可以胜过参数量达 1750 亿的 GPT-3。

  LLaMA 的开源可是利好众多研究者,比如斯坦福在 LLaMA 的基础上加入指令微调(instruct tuning),训练了一个名为 Alpaca(羊驼)的 70 亿参数新模型(基于 LLaMA 7B)。结果显示,只有 7B 参数的轻量级模型 Alpaca 性能可媲美 GPT-3.5 这样的超大规模语言模型。

  又比如,我们接下来要介绍的这个模型 GPT4All,也是一种基于 LLaMA 的新型 7B 语言模型。项目上线两天,Star 量已经突破 7.8k。

  简单来讲,GPT4All 在 GPT-3.5-Turbo 的 800k 条数据上进行训练,包括文字问题、故事描述、多轮对话和代码。

  我们先来看看效果。如下图所示,用户可以和 GPT4All 进行无障碍交流,比如询问该模型:「我可以在笔记本上运行大型语言模型吗?」GPT4All 回答是:「是的,你可以使用笔记本来训练和测试神经网络或其他自然语言(如英语或中文)的机器学习模型。重要的是,你需要足够可用的内存 (RAM) 来适应这些模型的大小……」

  接下来,如果你不清楚到底需要多少内存,你还可以继续询问 GPT4All,然后它给出回答。从结果来看,GPT4All 进行多轮对话的能力还是很强的。

  有人将这项研究称为「改变游戏规则,有了 GPT4All 的加持,现在在 MacBook 上本地就能运行 GPT。」

  这份初步的技术报告简要描述了 GPT4All 的搭建细节。研究者公开了收集的数据、数据整理程序、训练代码和最终的模型权重,以促进开放研究和可重复性,此外还发布了模型的量化 4 位(quantized 4-bit)版本,这意味着几乎任何人都可以在 CPU 上运行该模型。

  首先,研究者通过利用三个公开可用的数据集来收集不同的问题 /prompt 样本:

  参考斯坦福大学 Alpaca 项目 (Taori et al., 2023),研究者对数据准备和整理给予了大量关注。在收集了最初的 prompt 生成对的数据集后,他们将数据加载到 Atlas 进行整理和清理,删除了所有 GPT-3.5-Turbo 未能响应 prompt 并产生畸形输出的样本。这使得样本总数减少到 806199 个高质量的 prompt - 生成对。接下来,研究者从最终的训练数据集中删除了整个 Bigscience/P3 子集,因为它的输出多样性非常低。P3 包含许多同质化的 prompt,这些 prompt 从 GPT-3.5-Turbo 中产生了简短而同质化的反应。

  这种排除法产生了一个包含 437,605 个 prompt - 生成对的最终子集,如图 2 所示。

  研究者在 LLaMA 7B (Touvron et al., 2023) 的一个实例中将几个模型进行微调。他们最初的公开版本相关的模型是用 LoRA (Hu et al., 2021) 在 437605 个后处理的例子上以 4 个 epoch 训练的。详细的模型超参数和训练代码可以在相关的资源库和模型训练日志中找到。

  研究者发布了所有的数据(包括未使用的 P3 generations)、训练代码和模型权重,供社区进行复现。感兴趣的研究者可以在 Git 存储库中找到最新的数据、训练细节和检查点。

  研究者大概用了四天的时间制作这些模型,GPU 成本为 800 美元(从 Lambda 实验室和 Paperspace 租的,其中包括几次失败的训练),此外还有 500 美元的 OpenAI API 费用。

  这个模型可以在普通笔记本上运行,真就像网友说的「除了电费之外,没有任何成本。」

  研究者使用 SelfInstruct 论文 (Wang et al., 2022) 中的人类评估数据对该模型进行了初步评估。报告还对比了该模型与已知最好的公开的 alpaca-lora 模型(该模型由 huggingface 的用户 chainyo 提供)的 ground truth 困惑度。他们发现,所有的模型在少数任务上都有非常大的困惑度,并且报告的困惑度最大为 100。与 Alpaca 相比,在这个收集的数据集上进行微调的模型在 Self-Instruct 评估中表现出了更低的困惑度。研究者表示,这个评估不是详尽的,仍存在进一步的评估空间 —— 他们欢迎读者在本地 CPU 上运行该模型(文件见 Github),并对它的能力有一个定性的认识。

  最后,需要注意的是,作者公布了数据和训练细节,希望它能加速开放的 LLM 研究,特别是在对齐和可解释性领域。GPT4All 模型的权重和数据仅用于研究目的,并获得许可,禁止任何商业使用。GPT4All 是基于 LLaMA 的,LLaMA 具有非商业许可。助理数据是从 OpenAI 的 GPT-3.5-Turbo 收集的,其使用条款禁止开发与 OpenAI 进行商业竞争的模型。© THE END

电脑内存录入:admin    责任编辑:admin 
  • 上一个电脑内存:

  • 下一个电脑内存: 没有了
  •  
     栏目文章
    普通电脑内存 笔记本就能运行的ChatGPT平替来了附完整版技术… (04-13)
    普通电脑内存 松下笔记本火了?这价格你接受不了!看看1699… (04-13)
    普通电脑内存 如何确定工业主板是否优质 (04-12)
    普通电脑内存 谷歌正改进Chrome以减少win10的内存占用率 (04-12)
    普通电脑内存 江波龙亮相CES 2023 从科技趋势看存储新风向 (04-12)
    普通电脑内存 激发存储无限潜力 Solidigm持续推动固态存储技… (04-12)
    普通电脑内存 性能如何?我们一测便知 (04-12)
    普通电脑内存 外存储器(外存储器英文) (04-12)
    普通电脑内存 台式电脑开机显示英文怎么办 电脑出现蓝屏说一… (04-12)
    普通电脑内存 ram是什么意思英语怎么读音(电脑ram是什么意… (04-12)
    普通电脑内存 扩展内存用英语怎么说 扩展内存英语翻译 (04-12)
    普通电脑内存 在计算机存储单位中通常用大写英文字母来表示… (04-12)
    普通电脑内存 内存ddr4和ddr5的区别 内存4和5性能差别大吗? (04-11)
    普通电脑内存 2022年全球智能手机内存市场规模同比大降23% (04-11)
    普通电脑内存 64G内存耗电 (04-11)
    普通电脑内存 内存性价比天花板良心价还得看国产金百达DDR4… (04-11)
    普通电脑内存 内存条你真的会用吗?双通道内存的性能超单通… (04-11)
    普通电脑内存 计算机的内存、外存、主辅存 (04-10)
    普通电脑内存 电脑内存的作用是什么? (04-10)
    普通电脑内存 电脑内存是什么(电脑内存是什么意思) (04-10)