返回首页  设为首页  加入收藏  今天是:
网站首页电脑主板电脑cpu电脑内存电脑硬盘电脑显卡电脑电源显示器电脑配件电脑维修
相关文章
 显卡可能没那么重要了?中国…
 高效能散热设计解决电脑风扇…
 ROG GX700VO
 电脑主机声音大是什么原因 如…
 电脑如何硬盘分区
 如何判断电脑硬盘是否损坏
 苹果电脑如何使用移动硬盘
 2024年08月18日B
 华硕全家桶:海哥的新智能维…
 最新热点_文字链
 520礼物推荐:送给他她的高性…
 像斧子一样的键盘绝了!
 如何知道笔记本电脑型号
 联想YOGA Pad Pro:开创超材…
 3060显卡降价至3000元清华北…
 清华紫光清华之星T6340E-02
 小米新款笔记本即将发布 459…
 骁龙X Elite:赋能轻薄笔记本…
 粗心居民将笔记本电脑当垃圾…
 盘点2024年最保值主板型号DI…
 主板选购指南:打造理想电脑…
 2024年12月29日Bl
 Linux内核优化:一行代码引领…
 4K对齐:提升电竞体验的关键…
 40倍性能提升:一行代码改变…
 显卡从哪里看
 影驰显卡性能评测与用户体验…
 显卡深度剖析:从性能分级到…
 骨伽LLC 750金牌电源评测 金…
 小机箱电脑配置推荐:畅享高…
 一见倾心!2024年最佳游戏电…
 精细、便携、高速——雷克沙…
 西部数据1TB 64M SATA2绿盘
 Solidigm P44 Pro
 高德地图与联想百应合作推出…
 商州区上门换汽车轮胎道路救…
 漳县附近修车补胎紧急救援
 组装电脑必看:Intel处理器报…
 2023年DIY电脑配件行情回顾:…
 四千元组装电脑配置领略超越…
 显示器十大品牌排行榜
 这么好看的显示器值得你的关…
 2024年最佳显示器推荐:提升…
 无锡同城玩家装机体验:EVA联…
 极致体验:打造高逼格电脑硬…
 酷睿Ultra 9 285K超频逼近75…
 装机首选华硕B650X870主板 打…
 北京鲲鹏凌昊发布革命性CPU板…
 拯救者2023:一招自查电脑故…
 华为翻新机型再现超高性价比…
专题栏目
网络
您现在的位置: 电脑评测网 >> 电脑显卡 >> 正文
高级搜索
显卡可能没那么重要了?中国公司给硅谷好好上了一课
作者:佚名 文章来源:本站原创 点击数: 更新时间:2025/1/4 23:21:56 | 【字体:

  qq炫舞音飞官网中国公司DeepSeek发布开源大模型V3,性能国际一流,技术力牛逼,价格击穿地心。

  02V3在性能方面全面领先开源模型,训练周期花费不到280万GPU时,而Llama 3.1 405B训练周期花费了3080万GPU时。

  03为此,DeepSeek通过通信和显存优化、推理专家的负载均衡以及FP8 混合精度训练等技术革新,提升了模型效率。

  04尽管DeepSeek在商业化方面相对较弱,但其成功证明了在AI赛道上还存在更多的可能。

  我是万万没想到,就在西方还沉浸在圣诞假期,疯狂 “ 过年 ” 的时候,咱们中国企业给人家放了个新年二踢脚,给人家脑瓜子崩得嗡嗡得。

  前几天, DeepSeek 刚刚公布最新版本 V3 ,注意,与大洋彼岸那个自称 Open ,却越来越 Close 的公司产品不同,这个 V3 是开源的。

  不过开源还不是他最重要的标签, DeepSeek-V3( 以下简称 V3 )还兼具了性能国际一流,技术力牛逼,价格击穿地心三个特点,这一套不解释连招打得业内大模型厂商们都有点晕头转向了。

  V3 一发布,OpenAI创始成员 Karpathy 直接看嗨了,甚至发出了灵魂提问,难道说大模型们压根不需要大规模显卡集群?

  比如奥特曼就搁那说,复制比较简单啦,很难不让人觉得他在内涵 DeepSeek 。

  早在 2019 年,幻方就投资 2 亿元搭建了自研深度学习训练平台 “ 萤火虫一号 ” ,到了 2021 年已经买了足足 1 万张英伟达 A100 显卡的算力储备了。

  而正是凭借这部分硬件储备,幻方才拿到了 AI 大模型的入场券,最终卷出了现在的 V3 。

  深度求索的 CEO 梁文锋在接受暗涌采访的时候给大家聊过,并不是那么看中 AI 前景。

  而是在他们看来, “通用人工智能可能是下一个最难的事之一” ,对他们来说, “ 这是一个怎么做的问题,而不是为什么做的问题。 ”

  就是抱着这么股 “ 莽 ” 劲,深度求索才搞出了这次的大新闻,下面给大家具体讲讲 V3 有啥特别的地方。

  首先就是性能强悍,目前来看,在 V3 面前,开源模型几乎没有一个能打的。

  还记得去年年中,小扎的 Meta 推出模型 Llama 3.1 ,当时就因为性能优秀而且开源,一时间被捧上神坛,结果在 V3 手里,基本是全面落败。

  而在各种大厂手里的闭源模型,那些大家耳熟能详的什么 GPT-4o 、 Claude 3.5 Sonnet 啥的, V3 也能打得有来有回。

  大家大概都知道了,现在的大模型就是一个通过大量算力,让模型吃各种数据的炼丹过程。

  所以在圈子里有了一个新的计量单位 “GPU 时 ” ,也就是用了多少块 GPU 花了多少个小时的训练时间。

  以钱来换算, DeepSeek 搞出 V3 版本,大概只花了 4000 多万人民币。

  你别以为 DeepSeek 靠的是什么歪门邪道,人家是正儿八经的有技术傍身的。

  为了搞清楚 DeepSeek 的技术咋样,咱们特地联系了语核科技创始人兼 CTO 池光耀,他们主力发展企业向的 agent 数字员工,早就是 DeepSeek 的铁粉了。

  池光耀告诉我们,这次 V3 的更新主要是 3 个方面的优化,分别是通信和显存优化、推理专家的负载均衡以及FP8 混合精度训练。

  各个部分怎么实现的咱也就不多说了,总体来说,大的整体结构没啥变化,更多的像是咱们搞基建的那一套传统艺能,把工程做得更高效、更合理了。

  首先, V3 通过通信和显存优化,极大幅度减少了资源空闲率,提升了利用效率。

  而推理专家( 具备推理能力的 AI 系统或算法,能够通过数据分析得出结论 )的负载均衡就更巧妙了,一般的大模型,每次启动,必须把所有专家都等比例放进工位( 显存 ),但真正回答用户问题时,十几个专家里面只用到一两个,剩下的专家占着工位( 显存 )摸鱼,也干不了别的事情。

  而 DeepSeek 把专家分成热门和冷门两种,热门的专家,复制一份放进显存,处理热门问题;冷门的专家也不摸鱼,总是能被分配到问题。

  FP8 混合精度训练则是在之前被很多团队尝试无果的方向上拓展了新的一步,通过降低训练精度以降低训练时算力开销,但却神奇地保持了回答质量基本不变。

  通过一直以来的技术更新迭代, DeepSeek 收获的回报也是相当惊人的。

  他们 V3 版本推出后,他们的价格已经是低到百万tokens几毛钱、几块钱。

  他们甚至还在搞了个新品促销活动,到明年 2 月 8 号之前,在原来低价的基础上再打折。

  而一开始提到同样开源的 Claude 3.5 Sonnet ,每百万tokens,至少都得要几十块以上。。。

  早在去年初,DeepSeek V2 模型发布后,就靠着一手低价,被大家叫做了AI 界拼多多。

  他们还进一步引发了国内大模型公司的价格战,诸如智谱、字节、阿里、百度、腾讯等大厂纷纷降价。

  池光耀也告诉我们,他们公司早在去年 6 、 7 月份就开始用上了 DeepSeek ,当时也有国内其他一些大模型厂商来找过他们。

  但和 DeepSeek 价格差不多的,模型“ 又太笨了,跟 DeepSeek 不在一个维度” ;如果模型能力和 DeepSeek 差不多,那个价格 “基本都是 10 倍以上” 。

  更夸张的是,由于技术 “ 遥遥领先 ” 带来的降本增效,哪怕 DeepSeek 卖得这么便宜,根据他们创始人梁文峰所说,他们公司还是赚钱的。。。是不是有种隔壁比亚迪搞 998 ,照样财报飘红的味道了。

  因为他的强项主要是在推理、数学、代码方向,而多模态和一些娱乐化的领域不是他们的长处。

  而且眼下,尽管 DeepSeek 说自己还是赚钱的,但他们团队上上下下都有股极客味,所以他们的商业化比起其他厂商就有点弱了。

  但不管怎么说, DeepSeek 的成功也证明了,在 AI 这个赛道还存在的更多的可能。

  按以前的理解,想玩转 AI 后面没有个金主爸爸砸钱买显卡,压根就玩不转。

  我们不妨期待下未来,更多的优化出现,让更多的小公司、初创企业都能进入 AI 领域,差评君总感觉,那才是真正的 AI 浪潮才对。

电脑显卡录入:admin    责任编辑:admin 
  • 上一个电脑显卡:

  • 下一个电脑显卡: 没有了
  •  
     栏目文章
    普通电脑显卡 显卡可能没那么重要了?中国公司给硅谷好好上… (01-04)
    普通电脑显卡 显卡从哪里看 (01-03)
    普通电脑显卡 影驰显卡性能评测与用户体验分析 (01-03)
    普通电脑显卡 显卡深度剖析:从性能分级到硬件搭配与未来展… (01-03)
    普通电脑显卡 代号580易出神卡性能超RTX4060还有12G显存蓝戟… (01-02)
    普通电脑显卡 铭瑄加入英特尔AIC阵营预告拥有额外金手指“电… (01-02)
    普通电脑显卡 华为MateBook 14笔记本电脑:轻薄设计 (01-02)
    普通电脑显卡 2149元 蓝戟Intel Arc B580 Tri OC显卡终于开… (01-01)
    普通电脑显卡 ZOL推荐2024:瀚铠 AMD Radeon RX 6750 GRE 1… (01-01)
    普通电脑显卡 国产显卡摩尔线上线GB显存 (01-01)
    普通电脑显卡 惟楚有材于斯为盛 (12-31)
    普通电脑显卡 史无前例!全球最大企业横空出世市值超24万亿… (12-31)
    普通电脑显卡 新加坡华科发明显卡新专利:提升GPU存储能力的… (12-31)
    普通电脑显卡 Intel二代独显震撼登场性能拉满力撼RTX 5060! (12-30)
    普通电脑显卡 英特尔显卡爆卖 不仅能玩游戏 还能用于AI推理 (12-30)
    普通电脑显卡 华擎锐炫B580桌面显卡曝光:28GHz Xe2-HPG GP… (12-30)
    普通电脑显卡 RTX 5090 PCB板曝光!GDDR7显存和庞大的BGA封… (12-29)
    普通电脑显卡 巨无霸:英伟达 RTX 4090 Ti 显卡再次曝光四槽… (12-29)
    普通电脑显卡 蓝戟锐炫B580 Photon图赏:在保留标志性设计的… (12-29)
    普通电脑显卡 快科技2024年度评奖:显卡篇 (12-28)