AI收费的那些事儿

陈永伟2026-05-22 21:06

陈永伟

　　前不久，一则关于豆包即将收费的新闻引发舆论热议。根据报道，字节跳动旗下的国民级AI产品豆包正在考虑推出阶梯式付费体系，在保留免费基础版本的同时，推出68元、200元、500元三档月度会员套餐。消息一经披露，舆论场上立即出现了两种对立观点：一些人认为，头部AI平台先通过免费获取大批用户，然后再收费，是互联网行业新一轮的收割；另一些人则认为，为服务付费是商业社会的天经地义，AI平台选择收费，是摆脱行业内卷、维持行业健康发展的必然选择。

值得注意的是，在欧美地区，关于AI是否应该收费的争论似乎很少。OpenAI在推出ChatGPT后仅两个月，就推出了每月20美元的ChatGPTPlus订阅服务，后来又追加了每月200美元的ChatGPTPro。Anthropic也先后推出每月20美元的ClaudePro和每月200美元的ClaudeMax。通过对比不难看到，ChatGPT和Claude的收费额度都远高于豆包，但网上似乎很少出现关于这些产品是否应该收费的类似争议。

一、从“免费”到收费

在讨论开始前，我们首先需要明确一个事实：讨论AI服务是否应该收费，本身其实就是一个伪命题。所谓“天下没有免费的午餐”，所有商品只要被放在市场上，终究都要以某种方式收费。问题的关键，是这种收费到底通过怎样的方式实现，商品的费用究竟由谁承担。

在互联网时代，我们似乎享受了很多免费的商品。比如，我们用微信、刷抖音，但却从来没有为它们付过钱。但稍加分析就会发现，这种免费并非真的无人为产品付费，而是让付费主体从直接用户转移给了其他人。像微信、抖音这样的应用，本质上是平台，既可以连接人，也可以连接人和产品。通过算法，平台可以向用户推送定向广告，推荐相关产品，并从商户那里获得广告收入。从这个意义上讲，平台并没有提供免费服务，它只是用相关服务换取用户注意力，再将注意力货币化。

在过去很多年里，上述交叉补贴模式一直是互联网企业最重要的营利模式。尤其是在我国，平台模式的发达程度远胜于欧美，所以很多人都已经对“免费”习以为常。那么，这种模式是否可以直接照搬到AI服务上呢？

事实上，不少企业也曾尝试过这个模式，典型例子是微软。几年前，微软曾一度想将内置了GPT-4能力的BingChat，也就是后来的Copilot，免费、无限制地内置在Windows系统、Edge浏览器和必应搜索中。它当时的计划是：用免费的AI吸引用户使用必应，以此抢占谷歌的搜索广告份额，再通过广告收入和Windows生态补贴AI算力。然而，这个计划很快失败了。免费确实吸引了一部分用户，但没有带来预期收益。根据后来的媒体披露，微软在免费用户身上平均每人每月要亏损超过20美元，部分重度用户每人每月带来的亏损甚至超过80美元。面对巨大亏损，微软不得不不断加强对免费版BingChat的限制，并将更多营销资源放到实行订阅制的CopilotPro上。

交叉补贴模式之所以难以适用于AI，是由AI产品的特征决定的。

一方面，从供给侧看，AI产品具有边际成本较高且难以趋近于零的特性。传统互联网产品最大的优势是边际成本趋近于零。无论是服务器存储，还是信息分发的成本，都可以被海量用户无限摊薄，因而多新增一个用户所产生的额外资源消耗相对有限，反而会让产品平均成本变得更低。而AI产品完全不同，每一次对话交互、文档解析、图片生成、视频制作、逻辑推理，都会实时占用高性能GPU算力资源，机房供电、硬件散热、芯片折旧和带宽运维也会产生持续且刚性的费用。在这种情况下，AI企业的用户越多，成本压力就会越大。

另一方面，从需求侧看，AI产品也很难植入广告等盈利服务。社交软件、电商平台、短视频平台要植入广告，或者调节产品可见程度，都是相对容易的。这就给相关企业获得收入创造了条件，而AI产品则不具备这样的条件。在使用AI时，用户对回复要求很高，尤其是高价值用户，更会苛求准确性。一旦AI插入广告，或者其他与用户要求无关的诱导性信息，用户评价就会大幅降低。这种特性，几乎把交叉补贴最重要的实现渠道直接堵死了。

在上述两方面特征之下，交叉补贴这种在过去互联网产品中被证明有效的模式，就很难被简单克隆到AI产品上。因而，将收费从间接转向直接，就成为AI企业的必然选择。

二、为什么用户愿意付费？

现在，我们已经知道了AI企业为什么要放弃“免费”加交叉补贴的传统互联网产品模式。接下来的问题是：究竟什么样的AI产品才可以让用户愿意付钱。

在AI市场上，一个十分引人注目的现象是：不同AI产品的价格差距十分惊人。比如，以OpenAI较新的GPT-5.4模型为例，其API调用价为每100万词元（Token）的输入和输出价格分别为2.5美元和15美元，Anthropic的ClaudeOpus-4.7模型则分别高达5美元和25美元，两家公司的顶尖模型定价则更高。但用户对这两家企业的产品依然趋之若鹜，尤其是Claude，其客服支持向来被用户抱怨不够友好，账号封禁也时常引发争议，但用户却依然愿意为它买单。相比之下，很多AI竞品的价格只有它们的十几分之一，用户却丝毫不愿意买账。这看起来十分奇怪。因为从各类评测看，这些AI产品和GPT、Claude这些顶尖模型确实存在差距，但从数值上看，这个差距大概也就5%-10%，似乎并不算太大。

为什么5%-10%的性能差异，会导致价格上十几倍的差别呢？根本原因在于，人们对AI产品的评价与所谓的AI性能数字之间，并不是简单的线性关系。人们是否愿意为一个AI产品买单，主要取决于AI产生的价值是否大到足以改变他们的生产和生活方式。为了后面讨论方便，我把足以导致类似改变的价值称为“方向性价值”（DirectionalValue）。有时候，两款AI产品性能似乎相差很小，但如果这个差距恰好决定了方向性价值的有无，那么人们对它们的评价就会截然不同。

图像识别领域的例子可以说明这一点。2012年，辛顿（GeoffreyHinton）团队的AlexNet模型以84.7%的识别成功率斩获ImageNet图像识别大赛冠军。相比于2011年大赛冠军74.3%的准确率，AlexNet也只不过高了十个百分点。然而，就是这十个百分点，让两个模型的命运天差地别：2011年的冠军XRCE系统至今已几乎无人知晓，而AlexNet却向人们证明了深度学习算法的价值，最终掀起“深度学习革命”。在现实中，很多图像识别任务的准确率要求就在80%左右。比如在行人检测、商品识别、内容审核等任务中，如果AI识别的准确率超过80%，就可以具有实用价值，客户就愿意用它们替代部分人工工作。从这个意义上讲，辛顿团队表面上不过提升了10个百分点的准确率，但从根本上看，它是让AI从不可实用变成了可以实用，其“方向性价值”是不可估量的。

明白了这一点，我们就不难理解人们对不同AI产品在支付意愿上的差别了。虽然从评测数字上看，Claude、GPT这样的顶尖AI产品只是比一般AI产品好了那么“一点点”，但可能就是这么“一点点”，让前者具有了“方向性价值”，让用户愿意为它们付费。

这里需要指出的是，人们使用AI产品的目的是不同的，比如有的是为了编程，有的是为了生成图片。而由于资源限制，一个AI产品不可能同时在所有性能上都领先。那么，AI企业究竟是应该平衡发展所有能力，还是尽可能把资源用于发展某一项特定能力呢？根据“方向性价值”理论，后一种策略可能更优。所谓“伤其十指不如断其一指”，在资源有限的情况下，如果平均发展各种能力，最终很可能是每一项能力都比对手差“一点点”，不能形成“方向性价值”。在免费的情况下，用户可能愿意使用它们，但一旦收费，则可能一弃了之。相比之下，将资源押注某一个方向，更容易确保在这个方向上形成“方向性价值”。现实中，Anthropic投入主要资源专攻Claude的编程能力，OpenAI集中大量资源降低GPT的幻觉率，其原因就在于此。

三、AI收费的各种方式

在讨论完用户愿意为AI付费的必要条件后，我们继续来看AI企业可以用哪些方法实现收费。从总体上看，目前行业内的AI收费方案主要有如下几种：

第一种是买断制。顾名思义，这种收费方式就是将AI产品直接作为商品，一次性出售给用户。购买之后，用户将永久获得模型使用权，部署在本地使用，企业不会对其后续使用额外收费。

买断制源自软件行业的付费传统，是AI行业最早出现的收费方式，主要针对需要本地部署、需求固定、迭代缓慢的企业与机构，例如传统制造业、涉密单位、线下嵌入式智能设备厂商等。这种模式的优势十分明显：只需要一次性付费，交易便捷，产权清晰。由于数据都在本地运行，所以安全性也更有保证。

不过，随着行业发展，买断制的弊端也逐渐显露。AI行业升级迭代十分迅速。对用户而言，一次性买断AI产品的使用权，不仅费用高昂，而且会限制他们及时使用更新、更好的模型。而从AI供应商的角度看，在销售AI产品之后，他们往往还需要持续提供售后服务。如果用户采用一次性付费，这些后续服务成本就会成为沉重负担。在这样的情况下，将AI作为商品，通过一次性买断进行销售的模式开始淡出市场。与之对应的，把AI作为一种服务搬到云端的AIaaS模式则开始成为主流。

比如，特斯拉的自动驾驶系统FSD最早就实行过买断制，但后续实践证明，这种付费模式并不适应行业发展，因而不久之后就改为了订阅制。

第二种是订阅制。这种模式是随着AIaaS出现的，目前是C端市场最主流的收费方式，其目标群体主要是高频个人用户、办公从业者、自媒体、固定用量使用者。在这种模式之下，用户按月度或年度缴纳固定费用，并获得固定额度、算力和特定功能的使用权限。

订阅制的优势十分明显：预算透明、费用稳定、平台现金流连续稳定，用户无需担心突发扣费。不过，订阅制的短板也很突出：套餐额度和算力是固定的，而用户实际需求千差万别，这就导致供应量和使用量之间天然存在矛盾。低频用户使用过少，所以性价比很低；高频用户则容易触达额度上限，导致额度耗尽后算力被强制限流，模型质量断崖式下滑。从这个角度看，订阅制其实只适合使用频率稳定、需求波动不大的普通生产力人群。

第三种是按调用收费。这种模式也诞生于AIaaS阶段，主要针对低频开发者、小型创业团队、简易工具类服务商。在这种模式下，平台以单次接口调用为计费标准，无论AI输出质量高低、任务是否成功，均统一扣费。该模式最大优势是规则简单、收益稳健、风险较低。不过，其缺点也明显：它无法区分高低价值用户，高难度专业任务与简单闲聊扣费一致，导致收费与其所产生的价值脱节，算力资源浪费严重。由于这些缺点，该收费模式的应用场景日益减少，只有在某些标准化场景仍在使用。

第四种是按流量计费。顾名思义，这种收费模式就是将AI看作水、电一样的产品，在精细化流量使用的基础上收费。目前，这种模式是B端最流行的收费方式之一，被广泛用于专业开发者、技术团队和大中型企业。

在现实中，流量的计费方式有很多。比如，使用时长、浮点数等，都曾经被作为计费单位。但目前更普遍使用的计费单位是词元。所谓词元，是AI大模型处理的最小单位。AI大模型在处理一句话时，总是会先把它拆成几个词。比如，它在处理“我喜欢吃炸鸡”时，就可能把它拆成“我”“喜欢”“吃”“炸鸡”，这里的每一个词就是一个词元。词元与汉字或者英文单词之间很难形成一一对应关系。平均而言，1个词元大致相当于2-4个汉字，或者0.75-1个英文单词。

按流量计费的优势十分显著：它计费公平，能依据模型参数、文本长度、多模态难度动态调价，从而有效应对需求的高波动，保证资源高效利用。正是这些特征，让它非常适合“养龙虾”、氛围编程等使用量较大、使用强度波动较高的应用场景。至于其缺点，主要是计费逻辑较为晦涩，普通用户难以看懂，容易出现突发性高额账单。比如，在不久前的“龙虾热”中，就有一些用户因为没有控制好龙虾的词元调用量，收到了异常高额账单。

第五种是按成效收费（OBP）。相比于前面的收费模式，这种收费模式最贴近价值逻辑。在这种收费模式下，平台不收取基础费用，仅在AI完成有效任务、达成商业成效后扣费。虽然这种模式目前还比较新颖，但已经在不少结果可量化、商业转化明确的垂直行业，如智能客服、电商营销、医疗辅助诊断、金融风控中得到使用。比如，客服AI企业IntercomFin按照有效结案收费，单次成功工单0.99美元。

对于用户而言，这种模式非常有吸引力，因为它可以让他们有效规避使用失败的风险。但对于AI提供商来说，这意味着更高的责任负担和更大的收益波动。这个特征决定了，只有那些对自己的产品非常有信心的AI提供商，才敢于采用这种收费模式。

我们不难看到，收费模式其实是伴随着产业实践的发展而不断演进的。起初，AI产品主要以软件形式售卖，因而买断制就是最流行的收费方式。此后，随着云计算普及，AIaaS成为主流，由此演化出了按调用计费、按流量计费等模式。而在生成式AI出现之后，AI输出结果的随机性增大，为了满足用户对成功率的要求，又诞生了按成效收费的模式。可以预见，随着行业发展，还会出现各种新的收费模式。比如，虽然传统互联网广告模式很难简单照搬到AI产品上，但很多AI供应商依然在积极探索将广告与AI服务结合的方法。例如OpenAI已经开始推进ChatGPT广告试点，并推出自助广告管理器、CPC竞价和效果衡量工具。如果这一尝试成功，交叉补贴模式就可能在AI时代以新的形态得到重生。

四、AI收费的三组权衡

需要指出的是，无论AI供应商采取哪一种收费模式，他们在具体操作中都需要进行一系列权衡。

第一个权衡，是价格与销量之间的权衡。需求定律告诉我们，在其他条件不变时，用户对商品的需求通常会随商品价格上升而下降。因而，供应商出于利润最大化的考虑，就必须选择合适的价格水平，在销量和单位利润之间取得平衡。

在AI行业，类似矛盾也依然存在。单价下调固然能够降低用户准入门槛，提升使用频次，但低廉单价会直接压缩企业毛利；而定价过高虽然能抬高单笔收益，却会抑制用户使用意愿，造成算力资源闲置、流量萎缩。因此，究竟应该为AI服务设定怎样的单价，就成了摆在AI供应商面前的一大难题。

破解这个问题的关键，是搞清楚自身AI产品的“弹性”（elasticity），并以此为基础定价。所谓“弹性”，指的是一种商品需求量对价格变化的敏感程度。比如，如果一种商品的价格下降10%，对应需求上升20%，那么这种商品的弹性就是2。当一种商品的价格弹性大于1时，该商品被称为高弹性商品，此时降价造成的需求量扩张幅度大于单位利润下降幅度，供应商就可以通过降价获利；而当价格弹性小于1时，该商品被称为低弹性商品，此时降价造成的需求量扩张幅度会小于单位利润下降幅度，降价不但不会增加收益，反而会越降越亏。

AI服务究竟是高弹性的，还是低弹性的呢？在现有叙事中，它经常被描述为高弹性商品。很多人还将“杰文斯效应”（JevonsEffect）套用在AI上，认为就像19世纪煤价降低催生了人们使用更多的煤，导致煤的总销售量大幅上升一样，AI价格下降也会吸引更多人使用AI，导致AI服务总销量上升。在这种叙事之下，很多AI供应商都全力开启了低价模式，试图通过薄利多销获得更高收入。

但AI服务究竟是不是真的具有高弹性呢？从宏观层面看，这或许是对的，但具体到微观层面，至少到目前，可以支持这一判断的证据还很少。不久之前，麻省理工学院的梅尔特·德米雷尔（MertDemirer）教授等人曾使用OpenRouter和MicrosoftAzure这两个大型AIaaS市场的数据，对AI模型的需求弹性进行了测算。其公开摘要显示，研究估算出的初步短期价格弹性约在1附近，这意味着杰文斯效应的发挥空间可能有限。对于具体的AI产品而言，它们的弹性可能并没有想象中那么高，因此“卷”价格很可能不会让AI供应商的收入增加，反而会让其亏损。这有可能反过来压缩研发投资，让模型难以产生足以吸引用户付费的“方向性价值”，最终导致恶性循环。从这个角度看，如果AI供应商对于自己产品的吸引力没有足够信心，低价策略恐怕还是要谨慎使用。

第二个权衡，是免费与付费的权衡。不同于传统实体商品，AI服务是高度体验化的。它的价值无法肉眼感知，用户对其的评价，以及对其的付费意愿，都高度依赖个人使用经验。这种特性让免费与付费的边界划分，成为企业最难把控的博弈难点。

市场上有一个很有趣的现象：完全没有使用经验的新手用户，对AI能力仍处于模糊判断状态，往往主观高估人工智能的智能化水平，对服务抱有理想化预期，愿意为未知价值支付较高费用。出于FOMO，即“害怕错过”的心态，他们经常会花费大价钱抢先体验AI产品，或者报名学习相关课程。而对于那些使用频次高、经验丰富的熟手用户，他们反而会清晰认知AI存在幻觉、逻辑漏洞、能力上限等缺陷，从而产生“AI并无特殊价值”的主观判断，导致付费意愿下滑。

这种特殊的用户心理，让免费模式陷入双向矛盾。免费版本的初衷是降低试用门槛、扩大潜在用户体量、培养他们的使用和付费习惯，但对于AI服务，如果过分扩大免费版本覆盖面，反而可能事与愿违。新手用户通过免费版快速体验后，常会发现AI达不到心理预期，预期落差导致付费意愿断崖式下跌；而资深用户通过长期免费使用，熟悉产品短板，也可能更加不愿为瑕疵服务买单。与此同时，免费边界过宽，会造成大量低质量流量挤占算力，同时弱化付费功能稀缺性。因此，企业在制定付费策略时，必须平衡好免费和付费的边界，用“留白”来吸引用户。具体来说，对于大模型，免费版应仅保留基础娱乐、简易问答功能，限制长文本、高推理、多模态等高价值能力，通过能力差异制造价值感知。唯有如此，才既能保障新手入门体验，又能避免熟手过度白嫖，在普惠引流与商业转化之间寻找平衡。

第三个权衡，是不同版本之间的权衡。现实中，为了尽可能将不同用户的支付意愿转化为收入，多数AI供应商在收费时都会采取“版本化”（versioning）策略。在这种策略下，供应商会向用户提供不同版本的产品，不同版本之间存在明显优劣之分。比如，OpenAI就把ChatGPT分为免费版、Go版、Plus版、Pro版、商用版和企业版，每个版本可使用的功能和使用限额都存在明显差别，定价差别也很大。从产业经济学的角度看，这种策略其实就是一种纵向差异化。

需要指出的是，在实践当中，版本化策略存在一个内在矛盾：如果将层级之间的差距设计得过小，高阶用户会选择低价套餐套利，造成高端收益流失，形成所谓的 “ 蚕食效应 ”（cannibalization）。而如果将层级之间的差距设计得过大，就可能导致中间层级用户无法升级，产品销量断层。

为了应对这一矛盾，AI供应商应秉承“强隔离、缓梯度”的思路。一方面，他们应该在算力优先级、功能权限、服务协议、商用资质上设置硬性壁垒，保证不同版本之间形成清晰区隔，从根源防止蚕食效应。例如豆包、ChatGPT严格区分普通算力与专属算力，免费用户会在高峰期卡顿限流，付费用户则有独享加速通道，在技术层面拉开服务差距。另一方面，他们还需要弱化层级之间的价格鸿沟，设置相对平缓的价格梯度，避免价格断层阻碍用户升级。不过，在此基础之上，AI供应商还应该如何具体设计每一版本的服务和价格组合，依然是一个“艺术”问题，需要视具体情况进行权衡。

五、结语

成功让用户为自己的产品付费，是打通商业闭环的关键一步，更是行业从野蛮扩张走向理性成熟的成人礼。互联网时代以免费为底色，靠流量与广告完成价值循环；而步入智能时代，高昂算力成本与边际成本难以趋近于零的特性，决定了直接付费必将回归主流。只有读懂收费模式变化背后的逻辑，我们才有可能真正洞悉AI行业的本质，把握智能时代的发展大势。