lg-ad-r
  您当前的位置 : 寻医网 >> 聚焦 >>

DeepSeek来了,算力还重要吗?

时间:2025-02-09 16:44:06    来源:东方网    阅读量:15492   

近日来,人工智能大模型DeepSeek热度不减。

自ChatGPT引发新一波人工智能热潮以来,大模型产业发展对算力的依赖与日俱增。科技公司不惜投入高额算力用于模型训练,各地智算中心纷纷加速建设,高性能芯片供不应求。全球人工智能产业一度形成了“堆算力”的路径依赖。

然而,随着中国人工智能企业DeepSeek发布开源模型,通过优化算法降低了算力需求,达到了与ChatGPT比肩的性能。人们意识到:算力不是推动技术进步的唯一途径,算法进步也同样重要,西方构建的算力霸权正被逐步削弱。这也提出了新问题:推动人工智能产业发展,是否依旧有必要大规模投资算力?

对此,市政协委员、华东师范大学计算机科学与技术学院副院长贺樑认为,这次DeepSeek开源模型的问世对于我国在人工智能领域突破西方的科技封锁意义重大,但这并不代表算力不再重要。训练新的进阶模型和将模型用于全行业,拥有更强的算力基础设施依旧是成败的关键要素之一。算力依旧是重要战略资源,在很长一段时间里需求仍将持续增长,而美国将用各种手段“卡算力”以影响我们的人工智能科研进度。

“DeepSeek开源模型的出现,标志着通过算力来限制中国人工智能发展的策略并不成功。在有限算力的‘非公平竞争’下,中国不再抄作业,中国的年轻人提出了我们自己的原创技术,成果震动全球并向全球开源。”贺樑说,“但算力还是非常重要的战略资源,我们需更坚定地加以储备,支撑优秀的团队开展研究,更优的算力储备意味着在研发下一代模型的时间成本优势,为此国产算力芯片自主制造和生态能力必须争分夺秒地迎头赶上。”

相关论文表明,DeepSeek-V3的训练总成本约为557.6万美元。其训练成本虽较同类产品大幅降低,但母公司为了这次训练所付出的前期试错成本,外界则不得而知。有报道称,DeepSeek母公司幻方量化曾囤积上万张GPU芯片。没有储备的这些算力,DeepSeek的这次突破是不太可能的。

同时,训练大模型所需算力下降,不意味着社会总的算力需求下降。一个好用的模型带来的是千行万业的大规模应用,不远的将来,使用大模型将嵌入生活的方方面面,模型后训练和推理需求会大幅超过预训练算力需求。

贺樑还认为,算力基础设施的投入回报要用长远的、发展的眼光。“政府需要科学评估和着眼未来的硬件情况和市场需求,更多考虑如何为有创造力的科研团队提供算力保障,降低创新成本,提高创新速度,即使不赚钱、折旧快,依然要坚定地加速建设智能算力功能性公共服务设施。”

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

精彩内容
翻来覆去难入梦 按摩6个穴位让你睡得香

翻来覆去难入梦 按摩6个穴位让你睡得香

随着生活压力的不断增加,睡眠质量的好坏会直接影响我们第二天的神经状态。如果我们夜里常常辗转反侧、难以入眠...

儿童肿瘤治疗困局待解,多部门保障儿药产研

儿童肿瘤治疗困局待解,多部门保障儿药产研

相较于成人肿瘤药市场和研发的如火如荼,儿童肿瘤药市场显得冷清。然而,儿童肿瘤治疗领域存在更为迫切的临床需...

腰酸背痛偏爱上班族!腰背痛怎么缓解?

腰酸背痛偏爱上班族!腰背痛怎么缓解?

坐着痛、站着痛、走路痛,随时随地都在痛痛痛……现在的上班族已经成为了腰酸背痛的高发群体,上完一天班下来,...

方舟云康再度冲刺港股IPO亏损扩大、药品销售贡献超半数营收

方舟云康再度冲刺港股IPO亏损扩大、药品销售贡献超半数营收

近日,方舟云康控股有限公司向港交所递交招股书。在此之前,公司曾于2022年11月21日向港交所递交招股书...

经期延长,排不干净,是气虚,血热还是血瘀,赶紧先做个自我辨证

经期延长,排不干净,是气虚,血热还是血瘀,赶紧先做个自我辨证

后台读者来信:你好,我今年27岁,结婚快8年了,有两个小孩,做过2次流产手术,上个月大姨妈,来了已经有半...

衣服穿太多或会捂出病!宝宝冬季保暖,该这样做

衣服穿太多或会捂出病!宝宝冬季保暖,该这样做

天气冷了,很多家长都担心宝宝着凉了,于是不仅门窗紧闭,还里三层外三层地把他们包得严严实实的,甚至用被子蒙...

文章排行

关于我们 | 版权声明 | 广告业务 | 联系我们 | 网站地图

Copy 2006- news.qywc.cn 寻医网 版权所有   备案号:皖ICP备2023007381号

声明:本网站所转载信息,不代表本网观点,本网不承担此类稿件侵权行为的连带责任。邮箱:hchchc0324@163.com