DeepSeek 降价之后,一次企业 AI 任务到底多少钱?
DeepSeek 降价之后:一次 AI 任务到底多少钱?
DeepSeek 旗舰模型永久降价 75%。这条新闻看起来是模型厂商之间的价格战,但我更关心另一个问题:一次真实的企业 AI 任务,到底要花多少钱?
如果这个问题说不清,AI 落地就很容易走偏。
有人会觉得 AI 还很贵,所以继续观望。
也有人会觉得模型已经便宜了,于是所有流程都想上 AI。
这两个判断都太粗。
真正该问的是:这条流程原本的痛点是什么?它值多少钱?如果不用 AI,有没有更简单的工具能解决?如果接入 AI,一次任务大概消耗多少 token,又大概花多少钱?
只有把这笔账算清楚,企业才不会一边错过机会,一边乱花钱。
一、AI 便宜了,但不是所有流程都该上 AI
DeepSeek V4-Pro 的新价格很有冲击力。
根据 DeepSeek API 文档和 Bloomberg 报道,V4-Pro 在 75% 折扣永久化后,未命中缓存的输入价格为 0.435 美元 / 百万 token,输出价格为 0.87 美元 / 百万 token。缓存命中的输入价格更低。
这个价格意味着什么?
意味着很多过去看起来“可能太贵”的长流程任务,开始有了常态化运行的经济基础。
但我也想先把另一句话说在前面:AI 便宜了,不等于所有流程都应该上 AI。
如果一个原本 5000 元就能解决的问题,最后花 10 万元买了一套 AI 工具,那不是创新,是没算账。
企业是否需要接入 AI,某个流程是否需要换新的工具链,首先取决于这个流程原本的痛点和价值。
我们要先重新审视:这个流程到底卡在哪里?这个岗位的时间花在什么地方?这个工序有没有反复出错?如果改造成功,能节省多少时间、降低多少风险、增加多少收入,或者沉淀多少可复用经验?
只有把价值和痛点梳理清楚,AI 才能被正确匹配进去。
否则,AI 很容易变成一个昂贵的新玩具。
二、我们用内部样本算了一笔账
为了让这个问题更具体,我们看了一组看山实验室内部协同系统的匿名数据。
这不是行业大样本。
它更像一个小团队真实使用 AI 的切片:有日常对话,有文档梳理,有写作,有多工具调用,也有每日总结这类长上下文任务。
样本口径如下:
| 项目 | 数值 |
|---|---|
| 时间窗口 | 近 30 日 |
| 带 token 的助理回复 | 181 条 |
| 输入 token 合计 | 24,287,475 |
| 输出 token 合计 | 202,896 |
| 近 7 日带 token 回复 | 47 条 |
| 近 7 日输入 token | 7,243,955 |
| 近 7 日输出 token | 60,249 |
最明显的发现是:费用主要不在输出,而在输入。
也就是说,AI 真正“吃 token”的地方,往往不是它最后写了多少字,而是你给它塞进去了多少上下文、历史记录、工具结果和参考材料。
这和很多人的直觉相反。
大家容易盯着“生成一篇文章写了多少字”。
但在企业任务里,成本更常来自“让模型读了多少东西”。
三、一次任务大概是多少 token?
我们把近 30 日的 181 条助理回复按 total tokens 做了一个粗分桶。
| 任务量级 | 样本数 | 典型 token 量级 | 适合怎么理解 |
|---|---|---|---|
| 轻量任务 | 18 | 平均约 1.8 万 | 简短问答、短材料总结 |
| 中等任务 | 107 | 中位约 8.9 万 | 普通对话、多数工具辅助回合 |
| 重度任务 | 56 | 15 万以上 | 长上下文总结、批量梳理 |
| 每日总结类 | 16 | 中位约 33 万 | 日终批量整理、项目进度汇总 |
| 极端长上下文 | 个别样本 | 接近 79 万 | 大量材料一次性灌入模型 |
如果只看这张表,会有一个很直观的感觉:企业里的 AI 任务差异非常大。
一次轻量问答可能只有一两万 token。
一次普通的多工具对话,大概在 9 万 token 左右。
一次日终总结,可能到 33 万 token。
如果不做上下文压缩,极端任务可以接近 80 万 token。
这不是小差异。
轻量任务和重度总结之间,可以差十几倍到几十倍。
下面这个 Mermaid 图,是我们后续集成图表渲染时可以直接使用的草案:
四、按 DeepSeek V4-Pro 新价折算,大概多少钱?
下面这张表,按 DeepSeek V4-Pro 的新价做一个保守估算。
口径是:未命中缓存输入 0.435 美元 / 百万 token,输出 0.87 美元 / 百万 token。实际如果命中缓存,输入侧会更低;如果使用更便宜的 Flash 类模型,也会更低。
| 场景 | 近似 token | 粗略成本(美元) | 怎么看 |
|---|---|---|---|
| 轻量问答 / 短总结 | 1.8 万 | 约 0.008 | 不到 1 美分 |
| 普通多工具对话 | 8.9 万 | 约 0.04 | 约 4 美分 |
| 白板 / 材料总结中位 | 13.6 万 | 约 0.06 | 约 6 美分 |
| 每日总结中位 | 33 万 | 约 0.14 | 约 14 美分 |
| 多工具重度样本 | 30 万 | 约 0.13 | 与每日总结接近 |
| 极端长上下文样本 | 79 万 | 约 0.34 | 仍不到 0.5 美元 |
这组数字很有冲击力。
如果只看模型调用费,很多企业日常 AI 任务并没有想象中贵。
一次普通多工具对话,大概几美分。
一次比较重的每日总结,也就是十几美分量级。
哪怕一次极端长上下文任务,按未命中缓存估算,也还不到 0.5 美元。
这并不意味着企业可以随便浪费 token。
恰恰相反。
它说明模型费正在变成小头,真正的大头会转移到流程设计、系统集成、权限治理、数据清洗和人员培训上。
也就是说,模型降价以后,AI 项目更容易暴露出一个问题:如果流程本身没有价值,再便宜的模型也不划算。
五、为什么长流程任务反而值得关注?
在内部样本里,有一类任务很重:每日总结、白板总结、进度追踪。
它们一次可能吃掉十几万到几十万 token。
从技术直觉看,这类任务好像“很贵”。
但从经营视角看,它们反而值得认真看。
因为它们替代的不是一次简单问答,而是人的持续整理。
一个人每天花半小时整理项目进度、会议纪要、待办事项、客户反馈,一个月就是十几个小时。
如果 AI 每天花十几美分,把这些材料先整理成结构化草稿,再由人复核,这笔账很可能是划算的。
关键不在于 token 多不多。
关键在于它替代了什么。
如果它替代的是低价值重复劳动,值得。
如果它帮助团队少漏一个风险点,值得。
如果它让项目经验被沉淀下来,长期更值得。
但如果它只是把一堆本来没必要看的材料又总结了一遍,那就不值得。
这就是我一直说的:AI 落地要先做价值梳理。
六、真正要优化的是输入侧
这次数据还有一个很重要的提醒:输出 token 只占很小比例。
近 30 日样本里,输入 token 超过 2400 万,输出 token 只有约 20 万。
输出不到 1%。
所以企业用 AI 时,真正需要治理的是输入侧。
不要每次都把全部历史、全部文档、全部工具结果塞给模型。
要做摘要压缩。
要做分段处理。
要做检索。
要区分“必须放进上下文的信息”和“可以通过工具按需读取的信息”。
要让系统知道什么是长期记忆,什么是临时材料,什么是本次任务必须引用的事实。
这也是看山实验室关注“AI 经营现场”的原因。
一个好的 AI 系统,不应该只是把模型接进来。
它应该管理上下文。
它应该管理事件。
它应该管理权限。
它应该管理哪些信息值得进入下一次任务。
下面这个图,表达的是我们判断一个流程是否值得接入 AI 的基本路径:
七、不是“更便宜”,而是“更该算账”
DeepSeek 降价之后,很多人会说 AI 更便宜了。
这句话没错。
但我更想说的是:AI 更便宜了,所以我们更应该算账。
以前模型贵,很多项目还没开始就被挡住。
现在模型便宜,真正的筛选标准就变了。
一个流程是否值得上 AI,不再取决于“模型费能不能承受”,而取决于“这个流程本身有没有足够大的痛点和价值”。
如果一个任务一次只花 4 美分,但它帮你少读半小时材料,那很划算。
如果一个任务一次只花 1 美分,但它解决的是一个本来不存在的问题,那还是浪费。
如果一个长流程任务一次花 0.3 美元,但它每天替你完成项目整理、风险提示、待办追踪,那可能非常值得。
如果一个系统花 10 万元,只是为了把原本 5000 元能解决的问题包装成 AI,那就不值得。
这才是企业今天应该建立的判断方式。
八、给企业和园区的一个建议
不要从“全面 AI 化”开始。
这个词太大,容易把事情做虚。
从一条流程开始。
找一条现在最痛、最重复、又不涉及最高风险的流程。
比如项目材料预审。
比如客户需求整理。
比如政策信息监测。
比如合同初筛。
比如周报生成。
给它一个很具体的目标:两周内减少多少人工阅读时间?能不能把项目摘要统一成一种格式?能不能让负责人提前看到风险?能不能把过程沉淀到系统里?
同时也要给它一个很具体的成本边界。
模型调用费是一部分。
工具订阅费是一部分。
系统集成是一部分。
员工学习成本也是一部分。
这几项加起来,才是真正的 AI 成本。
如果你是园区或政府部门,也可以用同样的方法。
不要一上来就买一个“大模型平台”。
先开放几个非敏感场景,让本地服务商、小团队、创业公司来做低成本试点。
项目申报材料能不能先由 AI 预审?
入驻企业政策问答能不能先由 AI 分流?
园区服务事项能不能形成事件流?
产业线索能不能进入统一的项目池?
这些场景不一定轰轰烈烈,但很真实。
真实场景跑通之后,才会有真实案例。
真实案例多了,才会形成地方 AI 生态。
九、观望的成本正在变高
我写这篇文章,不是为了说 DeepSeek 降价会解决所有问题。
恰恰相反。
模型越便宜,越说明问题不在模型价格本身。
接下来拉开差距的,会是组织能力。
谁能更快找到真实场景,谁能更快跑出闭环,谁能把一次试点沉淀成方法,谁就会更早吃到 AI 的红利。
但这里的“真实场景”,不是拍脑袋选出来的。
它要经过价值梳理。
我们要重新看一遍流程、人员、工序和信息流:哪里真的痛,哪里只是看起来不顺;哪里值得用 AI,哪里用普通工具就够;哪里应该自动化,哪里必须保留人的判断。
这件事听起来不性感,却是 AI 落地最重要的前置工作。
DeepSeek 降价之后,模型门槛又低了一截。
所以问题也更直接了:
你的团队准备把 AI 接到哪一条真实流程里?
这条流程原本的痛点是什么?
它值得花多少钱、花多少时间去改?
一次任务大概消耗多少 token?
如果不用 AI,有没有更简单的工具能解决?
这些问题先答清楚,再去谈模型和系统。
不用等一年。
不用等下一代模型。
也不用等一个完美方案。
从一个项目开始。
从一次预审开始。
从一份周报开始。
从一条事件流开始。
先让 AI 进入一个值得改造的经营现场,再谈更大的想象。
参考来源:
- DeepSeek API Docs:Models & Pricing
https://api-docs.deepseek.com/quick_start/pricing - Bloomberg:DeepSeek To Make Permanent 75% Discount on Flagship AI Model
https://www.bloomberg.com/news/articles/2026-05-23/deepseek-to-make-permanent-75-discount-on-flagship-ai-model - 看山人工智能实验室:内部协同系统匿名 token 抽样(近 30 日 181 条助理回复)。