AI收费的那些事儿

陈永伟2026-05-22 21:06

陈永伟

  前不久,一则关于豆包即将收费的新闻引发舆论热议。根据报道,字节跳动旗下的国民级AI产品豆包正在考虑推出阶梯式付费体系,在保留免费基础版本的同时,推出68元、200元、500元三档月度会员套餐。消息一经披露,舆论场上立即出现了两种对立观点:一些人认为,头部AI平台先通过免费获取大批用户,然后再收费,是互联网行业新一轮的收割;另一些人则认为,为服务付费是商业社会的天经地义,AI平台选择收费,是摆脱行业内卷、维持行业健康发展的必然选择。

值得注意的是,在欧美地区,关于AI是否应该收费的争论似乎很少。OpenAI在推出ChatGPT后仅两个月,就推出了每月20美元的ChatGPTPlus订阅服务,后来又追加了每月200美元的ChatGPTPro。Anthropic也先后推出每月20美元的ClaudePro和每月200美元的ClaudeMax。通过对比不难看到,ChatGPT和Claude的收费额度都远高于豆包,但网上似乎很少出现关于这些产品是否应该收费的类似争议。

一、从“免费”到收费

在讨论开始前,我们首先需要明确一个事实:讨论AI服务是否应该收费,本身其实就是一个伪命题。所谓“天下没有免费的午餐”,所有商品只要被放在市场上,终究都要以某种方式收费。问题的关键,是这种收费到底通过怎样的方式实现,商品的费用究竟由谁承担。

在互联网时代,我们似乎享受了很多免费的商品。比如,我们用微信、刷抖音,但却从来没有为它们付过钱。但稍加分析就会发现,这种免费并非真的无人为产品付费,而是让付费主体从直接用户转移给了其他人。像微信、抖音这样的应用,本质上是平台,既可以连接人,也可以连接人和产品。通过算法,平台可以向用户推送定向广告,推荐相关产品,并从商户那里获得广告收入。从这个意义上讲,平台并没有提供免费服务,它只是用相关服务换取用户注意力,再将注意力货币化。

在过去很多年里,上述交叉补贴模式一直是互联网企业最重要的营利模式。尤其是在我国,平台模式的发达程度远胜于欧美,所以很多人都已经对“免费”习以为常。那么,这种模式是否可以直接照搬到AI服务上呢?

事实上,不少企业也曾尝试过这个模式,典型例子是微软。几年前,微软曾一度想将内置了GPT-4能力的BingChat,也就是后来的Copilot,免费、无限制地内置在Windows系统、Edge浏览器和必应搜索中。它当时的计划是:用免费的AI吸引用户使用必应,以此抢占谷歌的搜索广告份额,再通过广告收入和Windows生态补贴AI算力。然而,这个计划很快失败了。免费确实吸引了一部分用户,但没有带来预期收益。根据后来的媒体披露,微软在免费用户身上平均每人每月要亏损超过20美元,部分重度用户每人每月带来的亏损甚至超过80美元。面对巨大亏损,微软不得不不断加强对免费版BingChat的限制,并将更多营销资源放到实行订阅制的CopilotPro上。

交叉补贴模式之所以难以适用于AI,是由AI产品的特征决定的。

一方面,从供给侧看,AI产品具有边际成本较高且难以趋近于零的特性。传统互联网产品最大的优势是边际成本趋近于零。无论是服务器存储,还是信息分发的成本,都可以被海量用户无限摊薄,因而多新增一个用户所产生的额外资源消耗相对有限,反而会让产品平均成本变得更低。而AI产品完全不同,每一次对话交互、文档解析、图片生成、视频制作、逻辑推理,都会实时占用高性能GPU算力资源,机房供电、硬件散热、芯片折旧和带宽运维也会产生持续且刚性的费用。在这种情况下,AI企业的用户越多,成本压力就会越大。

另一方面,从需求侧看,AI产品也很难植入广告等盈利服务。社交软件、电商平台、短视频平台要植入广告,或者调节产品可见程度,都是相对容易的。这就给相关企业获得收入创造了条件,而AI产品则不具备这样的条件。在使用AI时,用户对回复要求很高,尤其是高价值用户,更会苛求准确性。一旦AI插入广告,或者其他与用户要求无关的诱导性信息,用户评价就会大幅降低。这种特性,几乎把交叉补贴最重要的实现渠道直接堵死了。

在上述两方面特征之下,交叉补贴这种在过去互联网产品中被证明有效的模式,就很难被简单克隆到AI产品上。因而,将收费从间接转向直接,就成为AI企业的必然选择。

二、为什么用户愿意付费?

现在,我们已经知道了AI企业为什么要放弃“免费”加交叉补贴的传统互联网产品模式。接下来的问题是:究竟什么样的AI产品才可以让用户愿意付钱。

在AI市场上,一个十分引人注目的现象是:不同AI产品的价格差距十分惊人。比如,以OpenAI较新的GPT-5.4模型为例,其API调用价为每100万词元(Token)的输入和输出价格分别为2.5美元和15美元,Anthropic的ClaudeOpus-4.7模型则分别高达5美元和25美元,两家公司的顶尖模型定价则更高。但用户对这两家企业的产品依然趋之若鹜,尤其是Claude,其客服支持向来被用户抱怨不够友好,账号封禁也时常引发争议,但用户却依然愿意为它买单。相比之下,很多AI竞品的价格只有它们的十几分之一,用户却丝毫不愿意买账。这看起来十分奇怪。因为从各类评测看,这些AI产品和GPT、Claude这些顶尖模型确实存在差距,但从数值上看,这个差距大概也就5%-10%,似乎并不算太大。

为什么5%-10%的性能差异,会导致价格上十几倍的差别呢?根本原因在于,人们对AI产品的评价与所谓的AI性能数字之间,并不是简单的线性关系。人们是否愿意为一个AI产品买单,主要取决于AI产生的价值是否大到足以改变他们的生产和生活方式。为了后面讨论方便,我把足以导致类似改变的价值称为“方向性价值”(DirectionalValue)。有时候,两款AI产品性能似乎相差很小,但如果这个差距恰好决定了方向性价值的有无,那么人们对它们的评价就会截然不同。

图像识别领域的例子可以说明这一点。2012年,辛顿(GeoffreyHinton)团队的AlexNet模型以84.7%的识别成功率斩获ImageNet图像识别大赛冠军。相比于2011年大赛冠军74.3%的准确率,AlexNet也只不过高了十个百分点。然而,就是这十个百分点,让两个模型的命运天差地别:2011年的冠军XRCE系统至今已几乎无人知晓,而AlexNet却向人们证明了深度学习算法的价值,最终掀起“深度学习革命”。在现实中,很多图像识别任务的准确率要求就在80%左右。比如在行人检测、商品识别、内容审核等任务中,如果AI识别的准确率超过80%,就可以具有实用价值,客户就愿意用它们替代部分人工工作。从这个意义上讲,辛顿团队表面上不过提升了10个百分点的准确率,但从根本上看,它是让AI从不可实用变成了可以实用,其“方向性价值”是不可估量的。

明白了这一点,我们就不难理解人们对不同AI产品在支付意愿上的差别了。虽然从评测数字上看,Claude、GPT这样的顶尖AI产品只是比一般AI产品好了那么“一点点”,但可能就是这么“一点点”,让前者具有了“方向性价值”,让用户愿意为它们付费。

这里需要指出的是,人们使用AI产品的目的是不同的,比如有的是为了编程,有的是为了生成图片。而由于资源限制,一个AI产品不可能同时在所有性能上都领先。那么,AI企业究竟是应该平衡发展所有能力,还是尽可能把资源用于发展某一项特定能力呢?根据“方向性价值”理论,后一种策略可能更优。所谓“伤其十指不如断其一指”,在资源有限的情况下,如果平均发展各种能力,最终很可能是每一项能力都比对手差“一点点”,不能形成“方向性价值”。在免费的情况下,用户可能愿意使用它们,但一旦收费,则可能一弃了之。相比之下,将资源押注某一个方向,更容易确保在这个方向上形成“方向性价值”。现实中,Anthropic投入主要资源专攻Claude的编程能力,OpenAI集中大量资源降低GPT的幻觉率,其原因就在于此。

三、AI收费的各种方式

在讨论完用户愿意为AI付费的必要条件后,我们继续来看AI企业可以用哪些方法实现收费。从总体上看,目前行业内的AI收费方案主要有如下几种:

第一种是买断制。顾名思义,这种收费方式就是将AI产品直接作为商品,一次性出售给用户。购买之后,用户将永久获得模型使用权,部署在本地使用,企业不会对其后续使用额外收费。

买断制源自软件行业的付费传统,是AI行业最早出现的收费方式,主要针对需要本地部署、需求固定、迭代缓慢的企业与机构,例如传统制造业、涉密单位、线下嵌入式智能设备厂商等。这种模式的优势十分明显:只需要一次性付费,交易便捷,产权清晰。由于数据都在本地运行,所以安全性也更有保证。

不过,随着行业发展,买断制的弊端也逐渐显露。AI行业升级迭代十分迅速。对用户而言,一次性买断AI产品的使用权,不仅费用高昂,而且会限制他们及时使用更新、更好的模型。而从AI供应商的角度看,在销售AI产品之后,他们往往还需要持续提供售后服务。如果用户采用一次性付费,这些后续服务成本就会成为沉重负担。在这样的情况下,将AI作为商品,通过一次性买断进行销售的模式开始淡出市场。与之对应的,把AI作为一种服务搬到云端的AIaaS模式则开始成为主流。

比如,特斯拉的自动驾驶系统FSD最早就实行过买断制,但后续实践证明,这种付费模式并不适应行业发展,因而不久之后就改为了订阅制。

第二种是订阅制。这种模式是随着AIaaS出现的,目前是C端市场最主流的收费方式,其目标群体主要是高频个人用户、办公从业者、自媒体、固定用量使用者。在这种模式之下,用户按月度或年度缴纳固定费用,并获得固定额度、算力和特定功能的使用权限。

订阅制的优势十分明显:预算透明、费用稳定、平台现金流连续稳定,用户无需担心突发扣费。不过,订阅制的短板也很突出:套餐额度和算力是固定的,而用户实际需求千差万别,这就导致供应量和使用量之间天然存在矛盾。低频用户使用过少,所以性价比很低;高频用户则容易触达额度上限,导致额度耗尽后算力被强制限流,模型质量断崖式下滑。从这个角度看,订阅制其实只适合使用频率稳定、需求波动不大的普通生产力人群。

第三种是按调用收费。这种模式也诞生于AIaaS阶段,主要针对低频开发者、小型创业团队、简易工具类服务商。在这种模式下,平台以单次接口调用为计费标准,无论AI输出质量高低、任务是否成功,均统一扣费。该模式最大优势是规则简单、收益稳健、风险较低。不过,其缺点也明显:它无法区分高低价值用户,高难度专业任务与简单闲聊扣费一致,导致收费与其所产生的价值脱节,算力资源浪费严重。由于这些缺点,该收费模式的应用场景日益减少,只有在某些标准化场景仍在使用。

第四种是按流量计费。顾名思义,这种收费模式就是将AI看作水、电一样的产品,在精细化流量使用的基础上收费。目前,这种模式是B端最流行的收费方式之一,被广泛用于专业开发者、技术团队和大中型企业。

在现实中,流量的计费方式有很多。比如,使用时长、浮点数等,都曾经被作为计费单位。但目前更普遍使用的计费单位是词元。所谓词元,是AI大模型处理的最小单位。AI大模型在处理一句话时,总是会先把它拆成几个词。比如,它在处理“我喜欢吃炸鸡”时,就可能把它拆成“我”“喜欢”“吃”“炸鸡”,这里的每一个词就是一个词元。词元与汉字或者英文单词之间很难形成一一对应关系。平均而言,1个词元大致相当于2-4个汉字,或者0.75-1个英文单词。

按流量计费的优势十分显著:它计费公平,能依据模型参数、文本长度、多模态难度动态调价,从而有效应对需求的高波动,保证资源高效利用。正是这些特征,让它非常适合“养龙虾”、氛围编程等使用量较大、使用强度波动较高的应用场景。至于其缺点,主要是计费逻辑较为晦涩,普通用户难以看懂,容易出现突发性高额账单。比如,在不久前的“龙虾热”中,就有一些用户因为没有控制好龙虾的词元调用量,收到了异常高额账单。

第五种是按成效收费(OBP)。相比于前面的收费模式,这种收费模式最贴近价值逻辑。在这种收费模式下,平台不收取基础费用,仅在AI完成有效任务、达成商业成效后扣费。虽然这种模式目前还比较新颖,但已经在不少结果可量化、商业转化明确的垂直行业,如智能客服、电商营销、医疗辅助诊断、金融风控中得到使用。比如,客服AI企业IntercomFin按照有效结案收费,单次成功工单0.99美元。

对于用户而言,这种模式非常有吸引力,因为它可以让他们有效规避使用失败的风险。但对于AI提供商来说,这意味着更高的责任负担和更大的收益波动。这个特征决定了,只有那些对自己的产品非常有信心的AI提供商,才敢于采用这种收费模式。

我们不难看到,收费模式其实是伴随着产业实践的发展而不断演进的。起初,AI产品主要以软件形式售卖,因而买断制就是最流行的收费方式。此后,随着云计算普及,AIaaS成为主流,由此演化出了按调用计费、按流量计费等模式。而在生成式AI出现之后,AI输出结果的随机性增大,为了满足用户对成功率的要求,又诞生了按成效收费的模式。可以预见,随着行业发展,还会出现各种新的收费模式。比如,虽然传统互联网广告模式很难简单照搬到AI产品上,但很多AI供应商依然在积极探索将广告与AI服务结合的方法。例如OpenAI已经开始推进ChatGPT广告试点,并推出自助广告管理器、CPC竞价和效果衡量工具。如果这一尝试成功,交叉补贴模式就可能在AI时代以新的形态得到重生。

四、AI收费的三组权衡

需要指出的是,无论AI供应商采取哪一种收费模式,他们在具体操作中都需要进行一系列权衡。

第一个权衡,是价格与销量之间的权衡。需求定律告诉我们,在其他条件不变时,用户对商品的需求通常会随商品价格上升而下降。因而,供应商出于利润最大化的考虑,就必须选择合适的价格水平,在销量和单位利润之间取得平衡。

在AI行业,类似矛盾也依然存在。单价下调固然能够降低用户准入门槛,提升使用频次,但低廉单价会直接压缩企业毛利;而定价过高虽然能抬高单笔收益,却会抑制用户使用意愿,造成算力资源闲置、流量萎缩。因此,究竟应该为AI服务设定怎样的单价,就成了摆在AI供应商面前的一大难题。

破解这个问题的关键,是搞清楚自身AI产品的“弹性”(elasticity),并以此为基础定价。所谓“弹性”,指的是一种商品需求量对价格变化的敏感程度。比如,如果一种商品的价格下降10%,对应需求上升20%,那么这种商品的弹性就是2。当一种商品的价格弹性大于1时,该商品被称为高弹性商品,此时降价造成的需求量扩张幅度大于单位利润下降幅度,供应商就可以通过降价获利;而当价格弹性小于1时,该商品被称为低弹性商品,此时降价造成的需求量扩张幅度会小于单位利润下降幅度,降价不但不会增加收益,反而会越降越亏。

AI服务究竟是高弹性的,还是低弹性的呢?在现有叙事中,它经常被描述为高弹性商品。很多人还将“杰文斯效应”(JevonsEffect)套用在AI上,认为就像19世纪煤价降低催生了人们使用更多的煤,导致煤的总销售量大幅上升一样,AI价格下降也会吸引更多人使用AI,导致AI服务总销量上升。在这种叙事之下,很多AI供应商都全力开启了低价模式,试图通过薄利多销获得更高收入。

但AI服务究竟是不是真的具有高弹性呢?从宏观层面看,这或许是对的,但具体到微观层面,至少到目前,可以支持这一判断的证据还很少。不久之前,麻省理工学院的梅尔特·德米雷尔(MertDemirer)教授等人曾使用OpenRouter和MicrosoftAzure这两个大型AIaaS市场的数据,对AI模型的需求弹性进行了测算。其公开摘要显示,研究估算出的初步短期价格弹性约在1附近,这意味着杰文斯效应的发挥空间可能有限。对于具体的AI产品而言,它们的弹性可能并没有想象中那么高,因此“卷”价格很可能不会让AI供应商的收入增加,反而会让其亏损。这有可能反过来压缩研发投资,让模型难以产生足以吸引用户付费的“方向性价值”,最终导致恶性循环。从这个角度看,如果AI供应商对于自己产品的吸引力没有足够信心,低价策略恐怕还是要谨慎使用。

第二个权衡,是免费与付费的权衡。不同于传统实体商品,AI服务是高度体验化的。它的价值无法肉眼感知,用户对其的评价,以及对其的付费意愿,都高度依赖个人使用经验。这种特性让免费与付费的边界划分,成为企业最难把控的博弈难点。

市场上有一个很有趣的现象:完全没有使用经验的新手用户,对AI能力仍处于模糊判断状态,往往主观高估人工智能的智能化水平,对服务抱有理想化预期,愿意为未知价值支付较高费用。出于FOMO,即“害怕错过”的心态,他们经常会花费大价钱抢先体验AI产品,或者报名学习相关课程。而对于那些使用频次高、经验丰富的熟手用户,他们反而会清晰认知AI存在幻觉、逻辑漏洞、能力上限等缺陷,从而产生“AI并无特殊价值”的主观判断,导致付费意愿下滑。

这种特殊的用户心理,让免费模式陷入双向矛盾。免费版本的初衷是降低试用门槛、扩大潜在用户体量、培养他们的使用和付费习惯,但对于AI服务,如果过分扩大免费版本覆盖面,反而可能事与愿违。新手用户通过免费版快速体验后,常会发现AI达不到心理预期,预期落差导致付费意愿断崖式下跌;而资深用户通过长期免费使用,熟悉产品短板,也可能更加不愿为瑕疵服务买单。与此同时,免费边界过宽,会造成大量低质量流量挤占算力,同时弱化付费功能稀缺性。因此,企业在制定付费策略时,必须平衡好免费和付费的边界,用“留白”来吸引用户。具体来说,对于大模型,免费版应仅保留基础娱乐、简易问答功能,限制长文本、高推理、多模态等高价值能力,通过能力差异制造价值感知。唯有如此,才既能保障新手入门体验,又能避免熟手过度白嫖,在普惠引流与商业转化之间寻找平衡。

第三个权衡,是不同版本之间的权衡。现实中,为了尽可能将不同用户的支付意愿转化为收入,多数AI供应商在收费时都会采取“版本化”(versioning)策略。在这种策略下,供应商会向用户提供不同版本的产品,不同版本之间存在明显优劣之分。比如,OpenAI就把ChatGPT分为免费版、Go版、Plus版、Pro版、商用版和企业版,每个版本可使用的功能和使用限额都存在明显差别,定价差别也很大。从产业经济学的角度看,这种策略其实就是一种纵向差异化。

需要指出的是,在实践当中,版本化策略存在一个内在矛盾:如果将层级之间的差距设计得过小,高阶用户会选择低价套餐套利,造成高端收益流失,形 成 所 谓 的 “ 蚕 食 效 应 ”(cannibalization)。而如果将层级之间的差距设计得过大,就可能导致中间层级用户无法升级,产品销量断层。

为了应对这一矛盾,AI供应商应秉承“强隔离、缓梯度”的思路。一方面,他们应该在算力优先级、功能权限、服务协议、商用资质上设置硬性壁垒,保证不同版本之间形成清晰区隔,从根源防止蚕食效应。例如豆包、ChatGPT严格区分普通算力与专属算力,免费用户会在高峰期卡顿限流,付费用户则有独享加速通道,在技术层面拉开服务差距。另一方面,他们还需要弱化层级之间的价格鸿沟,设置相对平缓的价格梯度,避免价格断层阻碍用户升级。不过,在此基础之上,AI供应商还应该如何具体设计每一版本的服务和价格组合,依然是一个“艺术”问题,需要视具体情况进行权衡。

五、结语

成功让用户为自己的产品付费,是打通商业闭环的关键一步,更是行业从野蛮扩张走向理性成熟的成人礼。互联网时代以免费为底色,靠流量与广告完成价值循环;而步入智能时代,高昂算力成本与边际成本难以趋近于零的特性,决定了直接付费必将回归主流。只有读懂收费模式变化背后的逻辑,我们才有可能真正洞悉AI行业的本质,把握智能时代的发展大势。

《比较》研究部主管