PG电子(中國)官方网站

从“聊天便宜”变成“Agent便宜”!DeepSeek-V4把大模型价格战推入“Agent时代”|PG电子-官方网站
从“聊天便宜”变成“Agent便宜”!DeepSeek-V4把大模型价格战推入“Agent时代”
栏目:公司新闻 发布时间:2026-04-26
 4月24日,在OpenAI发布GPT-5.5几小时后,DeepSeek-V4(预览版)发布。其用双版本配置推进大模型价格战,V4-Flash输出价仅为GPT-5.5 Pro的1.55‰,Pro版性能比肩顶级闭源模型。V4通过新注意力机制和同策略蒸馏技术降低成本,针对Agent场景优化,Pro版增强Agent能力,Flash版经济高效,为Agent规模化落地提供成本解决方案。  等了15个月,今

  4月24日,在OpenAI发布GPT-5.5几小时后,DeepSeek-V4(预览版)发布。其用双版本配置推进大模型价格战,V4-Flash输出价仅为GPT-5.5 Pro的1.55‰,Pro版性能比肩顶级闭源模型。V4通过新注意力机制和同策略蒸馏技术降低成本,针对Agent场景优化,Pro版增强Agent能力,Flash版经济高效,为Agent规模化落地提供成本解决方案。

  等了15个月,今天(4月24日),DeepSeek-V4(预览版本)终于发布了,而且是在OpenAI发布GPT-5.5几个小时后。

  在约1000字的DeepSeek-V4产品介绍文章中,Agent(智能体)一词出现了多达11次。

  DeepSeek-V4用专家模式(Pro)和快速模式(Flash)双版本配置,将大模型价格战从“聊天便宜”推进“Agent便宜”时代。

从“聊天便宜”变成“Agent便宜”!DeepSeek-V4把大模型价格战推入“Agent时代”(图1)

  DeepSeek-V4凭借全新稀疏注意力与同策略蒸馏技术,把推理成本压到新低,V4-Flash版输出价仅为GPT-5.5 Pro的1.55‰,V4-Pro版性能比肩全球顶级闭源模型。

  “低价快模型 + 高价强模型”组合,让DeepSeek-V4打通了Agent规模化落地的成本账。

从“聊天便宜”变成“Agent便宜”!DeepSeek-V4把大模型价格战推入“Agent时代”(图2)

从“聊天便宜”变成“Agent便宜”!DeepSeek-V4把大模型价格战推入“Agent时代”(图3)

  然而,不同于公司官方的API定价,OpenRouter平台会综合不同服务商渠道报价,按照各渠道实际调用流量加权计算得出的市场综合均价,也就是实际使用价格,该价格也会随时变动。

  《每日经济新闻》记者统计OpenRouter数据发现,截至4月24日13:30,本周调用量领先的国内外主流AI大模型中,DeepSeek-V4-Flash的成本优势突出,每百万Token的平均输出价低至0.279美元,仅为OpenAI新发布的GPT-5.5 Pro(180美元)的1.55‰。

从“聊天便宜”变成“Agent便宜”!DeepSeek-V4把大模型价格战推入“Agent时代”(图4)

从“聊天便宜”变成“Agent便宜”!DeepSeek-V4把大模型价格战推入“Agent时代”(图5)

  值得一提的是,业界一直在关注DeepSeek-V4是否会使用国产算力。DeepSeek在产品介绍文章中用小字表示,受限于高端算力,目前V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,V4-Pro的价格会大幅下调。

  DeepSeek在58页的技术报告《DeepSeek V4:迈向高效的百万Token上下文智能》提到,V4开创了一种全新的注意力机制,在Token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),相比于传统方法大幅降低了对计算和显存的需求。

  线在方法论上分岔的,是post-training(后训练)。技术报告中提到,V3.2的mixed RL(混合强化学习)阶段在V4被整体替换成了 On-Policy Distillation(同策略蒸馏)。

  新的流水线分两段。先分别训练几十个领域专家模型,覆盖数学、代码、Agent、指令跟随,产出一个在各个领域内极强的PG电子游戏 PG电子官网“偏科生”。

  在第二阶段,把十几个“教师模型”蒸馏到一个“学生模型”里。这种“先分头培养专家、再合并成通才”的路线,DeepSeek在报告里直接点名参考了思维机器实验室去年10月的on-policy distillation工作。

  OpenRouter与a16z联合发布的《2025 AI使用报告》覆盖超100万亿Token的匿名元数据,里面有一组数据极其关键——编程任务的Token占比从2025年初的11%飙到了50%以上,成为平台最大的单一使用品类。同时,Agent驱动的工作流产生的输出Token已超过平台总输出的一半。

  过去的问答式AI,一轮对话消耗几百到几千Token,用户不再提问,Token就不会再消耗。Agent模式下,机器可以持续在后台跑流程。极端假设Agent全天候运行,每天吞掉数十亿Token。

  因此,中国开源模型阵营几乎所有头部玩家都把Agent作为主攻方向,从架构到训练全链路为Agent场景做原生适配。

  价格较高但能力强的V4-Pro与快捷高效且价格便宜的V4-Flash的组合拳,恰好符合Agent的场景。

  DeepSeek称,V4-Pro性能比肩顶级闭源模型,而V4-Flash是更快捷高效的经济之选。

从“聊天便宜”变成“Agent便宜”!DeepSeek-V4把大模型价格战推入“Agent时代”(图6)

  ● 世界知识:DeepSeek-V4-Pro在世界知识测评中,大幅领先其他开源模型。

  ● 推理性能:在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。

  相比V4-Pro,V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。

  普通任务调用V4-Flash等低价模型,高难任务才调用V4-Pro。对DeepSeek来说,未来不是单纯比谁最强,而是比综合任务成本。

  所以,V4-Flash的意义不是“便宜一点”,而是把Agent场景,变成可以算账的生意。

  免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。

  如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

  特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。

  DeepSeek V4发布且适配国产芯片,国产算力股走强,科创芯片设计ETF易方达(589030)标的指数涨超2%

  ETF今日收评 港股信息技术、科创芯片等ETF涨超3%,通信相关ETF跌约4%

  2024年四川省专利密集型产业增加值6773.2亿元,占GDP比重10.49%

  “不诱于誉,不恐于诽”!DeepSeek致谢近300名研发者,10名“已离职”大将赫然在列

  前新财富医药“一姐”张明芳控诉杭州德诺电生理,索要关键协议原件15个月未果!超6亿元股权交易之争牵扯多家国资背景基金、知名创投及上市公司

  海外评测DeepSeek-V4:智能体任务排名开源第一,幻觉率上升,Token消耗大

  伊朗最高领袖或与普京首次会晤!被曝“身负重伤”:一条腿已手术3次将安假肢,面部烧伤说话困难,与官员通信靠信使接力传递信件

  美国“原油内幕交易”疑云:35亿美元,5次“抢跑”;海外评测DeepSeek-V4,智能体任务排名开源第一;CPU需求被引爆,英特尔、AMD今年市值增长3万亿元 一周国际财经

  央行:持续整治金融机构“内卷式”竞争,高质量统筹做好金融“五篇大文章”

  南方多省电价突然飙升,广东4月多次逼近1元/度!什么原因?专家:霍尔木兹海峡局势致燃料成本大幅攀升,工业生产旺盛拉高用电需求

  广东电价突然飙升,4月多次逼近1元/度!谁在“推高”电费?省间送电为啥没压住电价?