返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 刷新世界记录!40B模型+20万…
 联想电脑如何进行bios设置 联…
 虚拟机是什么
 京东1111电脑组件市场百花齐…
 从京东618全周期看DIY消费趋…
 16GB及以上显存显卡成交额同…
 联想y400配置怎么样 联想y40…
 联想MWC2025:秀翻全场首款外…
 联想推出三屏笔记本电脑配件…
 固态硬盘什么牌子好
 移动固态硬盘怎么保养 移动固…
 导购_移动存储频道移动硬盘U…
 欧美砖一线二线三显卡 MBA智…
 如何正确设置显示器的刷新率
 制造工艺是什么
 微软确认Win11 KB5058405 存…
 玉溪市人民政府
 风中屹立不倒!家庭娱乐办公…
 便携显示屏-便携显示屏品牌、…
 超清双屏多种形态雕塑家238英…
 轻薄便携华为MatePad Air全金…
 吾空凌云L16慧享AI PLUS轻薄…
 8月 “ 最值得入手 ” 的四款…
 8月份推荐4款 “ 接近完美 ”…
 1999元AI眼镜炸场!小米史上…
 小板一边去!揭秘双敏H61大板…
 蓝宝石 RADEON RX Vega 56 8…
 2024年07月21日B
 国际实业(000159):新疆国际…
 “Z世代”在读什么?
 京瓷复印机维修代码介绍【详…
 县乡社区_蚌埠第一生活门户网…
 复印机使用常识有哪些 复印机…
 成都台式机配件
 成都市哪里有批发电脑的成都…
 台式机配件
 闪迪2025年发布多款“超级U盘…
 小白也可以实践的5个磁盘数据…
 廉价版MacBook售价曝光OpenA…
 白色高颜散热出众 影驰 GeFo…
 真甜品显卡:老外买显卡两次…
 AMD Radeon RX 9060 XT天梯榜…
 电压稳成一条线暗黑电源开箱…
 旗舰笔电来袭飞腾D3000M性能…
 电压稳成一条线暗黑电源开箱…
 联想取得电子设备专利屏幕模…
 胜利女神t0阵容推荐 胜利女神…
 华为MatePad Air 2025款:AI…
 AIDA64怎么查看CPU风扇 AIDA…
 CPU风扇转速多少正常 一起来…
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑内存 >> 正文
高级搜索
刷新世界记录!40B模型+20万亿token散户组团挑战算力霸权
作者:佚名 文章来源:本站原创 点击数: 更新时间:2025/8/19 8:09:43 | 【字体:

  一夜缱绻未了情【新智元导读】全球网友用闲置显卡组团训练大模型。40B大模型、20万亿token,创下了互联网上最大规模的预训练新纪录!去中心化AI的反攻,正式开始。OpenAI等巨头的算力霸权,这次真要凉了?

  Psyche网络利用区块链技术,汇聚全球计算资源,成功启动了40B参数大语言模型Consilience的预训练任务,总计20万亿token,创下了迄今为止互联网上最大规模的预训练纪录。

  大语言模型Consilience采用DeepSeek V3的多头潜在注意力(MLA)架构,相较于Llama使用的GQA架构更具表达力,同时通过优化QKV投影矩阵减少计算开销。

  Psyche利用全球闲置的计算资源(如4090、A100和H100等消费级GPU),大幅降低训练成本。

  通过并行实验,Psyche鼓励开源社区提出新的模型架构和训练方法,未来可能催生更多创新。

  Psyche网络技术原理图,核心在于DisTrO优化器与Solana区块链

  过去,人们总觉得「AI模型的去中心化训练」不过是一种幻想,尤其在那些超越了爱好者规模的语言模型面前更是如此。

  但几项关键技术突破——尤其是并行化和强化学习——正在逐渐打破这种局限,让除了OpenAI、Anthropic这类大公司之外的小型团队也开始进入这个赛道。

  现在看来,聪明的算法可以弥补基础设施的不足,而像Nous Research这样的去中心化参与者正希望抓住这个机会。

  训练一个前沿模型需要数千个高性能GPU和超高带宽的集群,这使得普通研究者或小型团队几乎无法参与。

  这种集中化趋势不仅限制了创新,还可能导致少数科技去投垄断甚至控制AI模型。

  Hermes系列中规模最大的模型——Hermes 3 405B,是在基础的Llama 3.1模型上进行微调完成的。

  整个训练过程动用了128块H100 GPU,耗时约16小时(总计约2,086GPU小时)。

  从成本上看其实并不离谱——目前租用8块H100的计算节点每小时大约在16到24美元之间,因此一次完整训练的开销大约在5,000美元左右。

  如果我们不再依赖已有的模型,而是从零开始构建自己的基础模型,那我们就需要更庞大的“船”了。

  要以更大规模、低成本地实现类似的训练成果,确实面临不少挑战,尤其是当训练从集中化的GPU集群转向基于互联网的去中心化网络时。

  Nous Research提出了Psyche网络的解决方案:通过去中心化的方式,让全球的计算资源参与AI模型训练,降低进入门槛,推动AI发展的民主化。

  Nous Research的Psyche网络成功实现了去中心化的AI训练,开创了一个全新的模式。

  Consilience模型的预训练只是起点,未来Psyche网络有望成为AI民主化的重要基石,为开源社区和小型团队提供与科技巨头抗衡的机会。

  在传统的数据中心里,GPU之间通过极高带宽的连接(如NVLink或InfiniBand)相连,带宽可达每秒几百Gb(千兆位)。

  而相比之下,互联网上的志愿者节点,往往只有几十甚至几百Mb(兆位)每秒的带宽。

  质疑者认为,这种高达100倍甚至1,000倍的带宽差距,会让跨互联网的AI训练变得无比缓慢、几乎不可能。

  毕竟,传统的训练方式需要GPU之间持续地交换更新信息,而如果试图用普通家用网络来完成这些通信,很可能会陷入「灾难级」的训练体验。

  2024年12月,Nous与多位合作伙伴一起,在封闭测试网中,训练了一个150亿参数的基础模型,并成功验证了多项理论设想:

  在硅谷的一些圈子里,「加密」这个词几乎成了贬义词,而Nous一直努力保持与AI开发者之间的开放交流桥梁不被切断。

  也正因如此,他们这次将Psyche搭建在区块链上,是一个值得关注的重要转变。

  通过将技术栈迁移到Solana区块链,Nous希望释放区块链的以下三大优势:

  将这一协议向整个市场开放,意味着任何人都能拥有其中的一部分。而其潜在的扩展性之大,显然已经让不少极客兴奋不已。

  Nous的初期目标是先上线一个封闭测试网(Phase 0),验证是否能在Solana上运行一个更大规模、分布式、具备容错能力的DisTrO系统。后续阶段会逐步引入更高级的功能。

  在Phase 0阶段,贡献者可以携带自己的GPU加入进来(明确提到支持4090、A100和H100等型号),并开始获得奖励。此阶段会对参与者进行筛选,以防止恶意行为者加入。

  一旦系统稳定运行,权限将逐步开放,允许不同类型的计算资源(无论是专业的还是消费级的)自由接入网络,协助训练Llama、Diffusion等不同类型的模型架构。

  强化学习(Reinforcement Learning,RL)不依赖于预先准备好的数据集,而是通过模型与环境直接互动来学习。

  每个节点如果做出有助于模型进化的行为,就会获得正反馈,反之则获得负反馈。

  这极大缓解了传统训练中常见的「同步难题」,特别是在硬件能力和网络延迟差异大的情况下。

  而每个Psyche节点在训练过程中的表现都将影响它的奖励:计算能力更强或使用了更先进训练方法的节点,可能会获得更多代币激励。

  在常常被斥为「过度炒作又频频令人失望」的区块链生态中,能看到真正的创新成果,确实令人欣慰——简直让人「冷漠的灵魂也重新燃起了热情」。

  Nous并不是一开始就拥抱区块链技术的,相反,他们几乎是被「拖着、踢着、喊着」走上了这条路——

  他们需要一种方式,不论对方来自哪里,都能吸引计算资源与人才并进行公平支付;区块链,在这一点上表现得无比出色。

  他们需要一种手段,能够协调并扩展大规模训练任务;而协调与扩展,正是区块链技术的「第二天性」。

  他们还需要一种不受停电、封禁、宕机等影响的托管机制,能让项目「打不死」、无法被关闭;在这方面,区块链(这次不再是讽刺)也的确提供了最可靠的保障。

  而最值得欣慰的是:这一次,人们选择区块链,不是出于投机炒作,而是出于对实际问题的认真思考与真实需求的回应。

  如果Psyche成功了,它不仅将证明去中心化训练是切实可行的,更是回归初心:为取代的集中化计算,提供了强有力的工具。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  20岁王俊杰入选男篮亚洲杯最佳阵容,回应“最强暑假工”称号,郭士强:男篮目标是奥运入场券

  知名景区投资超8亿元的演出停演,回应:亏损是主要原因,演员已妥善安置;景区接待游客减少?真相是……

  王晶再曝港圈秘事:谢霆锋张柏芝线岁罗志祥近况曝光!去国外开演唱会和粉丝击掌

电脑内存录入:admin    责任编辑:admin 
  • 上一个电脑内存:

  • 下一个电脑内存: 没有了
  •  
     栏目文章
    普通电脑内存 刷新世界记录!40B模型+20万亿token散户组团挑… (08-19)
    普通电脑内存 联想电脑如何进行bios设置 联想电脑bios设置教… (08-19)
    普通电脑内存 虚拟机是什么 (08-19)
    普通电脑内存 2024年07月21日B (08-18)
    普通电脑内存 国际实业(000159):新疆国际实业股份有限公司… (08-18)
    普通电脑内存 “Z世代”在读什么? (08-18)
    普通电脑内存 1KB的存储空间能存储()个普通英文字符。 (08-17)
    普通电脑内存 手机内存不足别乱删记住这4个代码一次性清理大… (08-17)
    普通电脑内存 南阳市第六完全学校高级中学2025年招生简章 (08-17)
    普通电脑内存 导购空调_空气净化器_智慧空净频道_天极网 (08-16)
    普通电脑内存 海力士内存条多少钱 海力士内存条价格以及品牌… (08-16)
    普通电脑内存 台式电脑内存条的作用(台式电脑内存条的作用… (08-16)
    普通电脑内存 在医院做b超被 春雨电影 (08-15)
    普通电脑内存 苹果高管坦白:Siri延期原来是推倒了半成品重… (08-15)
    普通电脑内存 虚拟内存怎么设置最好 (08-15)
    普通电脑内存 特朗普集团将推智能手机“T1”土豪金配色售价… (08-14)
    普通电脑内存 挑战苹果Vision Pro:三星专利探索触控+手势系… (08-14)
    普通电脑内存 《巫师4》开发要主机优先!PS5力保60帧! (08-14)
    普通电脑内存 从严从实推进深入贯彻中央八项规定精神学习教… (08-13)
    普通电脑内存 【黑马早报】亚朵酒店回应出现医院枕套;迅雷… (08-13)