OpenAI的“iPhone时刻”?

陈永伟2023-11-20 21:44

陈永伟/文

在硅谷的历史上,从来没有一次发布会能像OpenAI的首次开发者大会那样让人彻夜难眠。

北京时间11月7日下午,一位AI领域的创业者在X(原推特)平台上分享了他从OpenAI开发者大会归来后的感受:“从大会现场开车回到家中,已是深夜。本想好好睡上一觉恢复一下体力,但实在翻来覆去睡不着”。在9月OpenAI放出要召开开发者大会消息后,这位创业者就赶紧进行了会议注册。而当大会召开前一周,看到山姆·阿尔特曼(SamAltman)在社交媒体上说“我们有一些很棒的新东西给你”时,他更是激动不已。然而,当他满怀期待地看完了整场大会后,却惊讶地发现,这个所谓的“新东西”竟然是对自己公司的“死刑判决书”。——“是的,阿尔特曼没有食言,他确实带来了很多新东西。但这一切本应是开发者们做的。而现在,他把这一切都做了,而我却不知道自己的公司还有什么开下去的必要!”

这位创业者并非个例。不少开发者们甚至用“血色婚礼”来形容这场大会。在X平台上,一张梗图流传甚广,图上记录了一位创业者对阿尔特曼的控诉:“山姆·阿尔特曼毁掉了我300万美元估值的创业公司,而我只得到了500美元的OpenAIAPI积分!”

这场开发者大会上究竟发生了什么,以至于让创业者们如此集体“泪奔”?OpenAI在这场大会上展示的新技术会对AI行业的发展带来怎样的影响?对于一般用户、AI内容创作者,以及创业者而言,这分别意味着什么?

那场会上,发生了什么?

大致上,OpenAI开发者大会的内容可以概括为“一个小结”和“三个发布”。

所谓“一个小结”,即OpenAI对自己过去一年来所做工作,以及所取得成绩的总结。阿尔特曼先简单介绍了OpenAI几款重要产品的现状:去年11月30日发布的GPT-3.5依然运行良好,3月发布的GPT-4是现在世界上最强大的AI模型,而其在近期发布的Dall-E3则是最先进的图形处理模型。随后,阿尔特曼用PPT上的三个数字——200万、92%和1亿概括了这些产品在市场上取得的成绩:“200万”指的是全球有200万开发者正在使用OpenAI的API开发各种应用;“92%”指的是有92%的财富500强公司正在使用OpenAI的产品搭建服务;“1亿”指的是现在ChatGPT的周活用户数为1亿。虽然这个总结环节加起来也就两三分钟,但其展示出的实力却胜过了千言万语的吹嘘。

所谓“三个发布”,指的是三个新产品的发布。

第一个发布的新产品是GPT-4Turbo。相比于原来的GPT-4,GPT-4Turbo又有了很大的进步:

一是增加了GPT可以理解的上下文长度。本来,GPT-4日常可以理解的上下文长度仅有8k,导致人们在和GPT聊天时,经常会聊得不尽兴。针对这一问题,OpenAI直接将上限提高了16倍,达到了128k。也就是说,如果用户乐意,可以一下子和GPT聊上一本三百页左右的书那么长。

二是给予了开发者更多的控制权。GPT-4Turbo允许开发者用新发布的JSON等模式更好地控制GPT,从而得到自己更想要的回答。此外,开发者还可以调用更多函数,让GPT的响应与回答更加稳定。

三是更新了知识库。将模型应用的知识集的截止日期从2021年9月更新到了2023年4月。也就是说,GPT终于可以和用户交流今年的事情了。

四是加入了多模态输入输出。GPT-4Turbo整合了DALL-E3、TTS、WhisperV3等OpenAI目前已经拥有的视觉和语音模型,未来可以实现图生图、语音输入等形式,甚至还能为开发者提供多种预设的声音选择。

五是向活跃开发者提供了GPT-4微调的资格。对于开发细分行业的垂直AI应用的开发者,OpenAI推出了定制化模型项目。这样,他们就可以更好地训练针对特定领域的GPT-4模型。

六是放宽了Token的速率限制。OpenAI把所有GPT-4用户的Token速率限制扩大了一倍。并且,开发者可以根据自身需要,申请进一步提高速率。

七是引入了“版权盾”(CopyrightShield)机制。根据OpenAI官网的介绍,版权盾大致理解为软件许可协议中的一种赔偿条款。有了版权盾,如果用户因使用OpenAI的产品而遭遇了版权纠纷,OpenAI可以为其提供素材来源、内容生成过程等证据来加以应对,并可能帮助其承担相关的侵权赔偿金。

客观地说,相对于同行,这些改进还称不上惊艳。以上下文的限制为例,在行业高度内卷的压力之下,以An-thropicClaude为代表的不少大模型都早已能实现数万,甚至数十万字的输入输出。针对外界吐槽很久的GPT-4“变笨”的问题,GPT-4Turbo则完全没有给出回应——或许,这是为了把更多的惊喜留给未来的GPT-5吧。综合来看,GPT-4Turbo虽然不错,但也只能算是中规中矩。

第二个发布的新产品是GPTs。所谓GPTs,顾名思义,就是以GPT为技术模板,衍生出的各种定制版GPT。也就是说,用户可以根据自己的需要,用自己提供的知识集合训练出自己专属的GPT。值得注意的是,用户并不需要任何复杂的编程知识,只用自然语言就可以完成对专属GPT的训练。为显示训练GPT的简便性,阿尔特曼在现场调出了GPT生成器(GPTBuilder),仅仅用了几轮简单的自然语言交互,并上传了一份他先前对创业者进行辅导的讲稿后,一个就业咨询专家GPT就生成了。整个过程仅仅用了不到一分钟,GPT甚至还贴心地帮助生成了一个漂亮的Logo。

GPTs的推出让个人训练AI智能体(AIagent)的成本极大地降低了。现在,一个人只要有独特的想法,就可以在不借助任何技术支持的情况下设计出各种有趣的定制GPT。为了鼓励人们创作的热情,阿尔特曼还同时介绍了GPT商店(GPTstore)。和手机上的应用商店一样,未来的创作者们可以将自己创作的GPT上传到GPT商店进行交易。

第三个发布的产品是AssistantsAPI。如果说GPTs是为个人用户设计的话,AssistantsAPI就主要是针对专业开发者的。相比于个人用户,专业开发者制作的AI智能体的功能通常会更多,但其开发过程也会相对复杂。过去,进行类似的开发工作可能需要较大规模的专业团队经过复杂的协作才能完成。而借用AssistantsAPI,开发者就可以创建一个具有特定指令、拥有额外知识、能调用各种模型和工具的“开发助手”,然后把开发过程中最复杂的问题交给它去做。这样一来,开发专业AI智能体的成本也会得到大幅下降。

当然,除了上述的“一个小结”和“三个发布”之外,这场仅有45分钟的大会还有一些值得关注的小插曲。比如,在发布完GPT-4Turbo之后,发布GPTs之前,阿尔特曼就邀请一位重量级嘉宾——微软的CEO萨蒂亚·纳德拉(SatyaNadella)上场发表了一番简单的讲话。纳德拉盛赞了OpenAI,并表示“微软深爱着OpenAI”。虽然从表面上看,纳德拉的这番表白完全是一种客套,但放在微软和OpenAI相爱相杀的大背景下,它依然是很有信息量的。这说明至少在未来的一段时间内,微软和OpenAI这种微妙的伙伴关系还将延续,OpenAI暂时不会有资金和资源方面的后顾之忧。

“科技春晚”为何成为“血色婚礼”?

对于OpenAI的这场开发者大会,普通用户和专业开发者的反应可谓截然相反。很多普通的用户直呼其为“魔法展示”、“科技春晚”,而专业开发者在这次大会后表现出的则更多是一种悲观,甚至绝望。原因很简单,那就是OpenAI现在已经把开发AI应用的门槛降得太低了,以至于让他们没有了生存空间。

在今年初ChatGPT爆火之后,AI赛道就涌入了大批的创业者。大致上,这些创业者可以分为两类:一类是从无到有,训练基础模型的;另一类则是调用GPT或者其他大模型能力开发产品的——或者用更为通俗的语言说,是做“套壳GPT”的。半年多后,第一类的创业者幸存下来的屈指可数。相比之下,第二类创业者的境况则要好得多。通过调用已有大模型的能力,他们可以轻松规避掉前期开发所需要的天量成本,只用进行一些微调、调用一些专业数据,就可以开发出新的产品。更为重要的是,相比起基础大模型,这些套壳的产品对垂直的行业和领域有更强的针对性,因而其变现也相对简单。

阿尔特曼对这种套壳创新表现得十分不以为然。在今年10月的YC校友分享会上,他就曾警告过这些所谓的AI公司,OpenAI将会逐渐拓展自己的模型产品领域。在生存空间越来越有限的情况下,采用套壳模式来生产AI产品的公司有可能走向衰亡。

我曾经和一位做GPT套壳的创业者聊过他对阿尔特曼警告的看法。当时,他显得非常地轻松和乐观。在他看来,阿尔特曼的警告更多可能是一种虚张声势。理由有二:第一,开发垂类的产品需要很多额外的知识,对于在这些领域没有积累的企业来讲成本并不会低,而与此同时,垂类产品的市场要比通用模型更小,所以其营利空间也更有限,像OpenAI这样的大公司很少会有兴趣来做这种“蚊子腿上找肉吃”的生意。第二,即使OpenAI要自己开发垂类产品,也会先瞄准那些市场空间相对较大、利润相对较为充足的领域。这样一个个做下来,等轮到他创业的这个相对冷门的领域,他可能都早就功成身退了。

然而,他们还是没有算到阿尔特曼的打法。诚然,OpenAI并没有亲自下场,去具体的垂类中和他们争抢那狭隘的市场,但仅仅在阿尔特曼发出那段“勿谓言之不预”的警告后一个月,他就发布了GPTs和AssistantsAPI。比起某个具体的垂类产品来说,这两样工具的杀伤力要远大得多。这就好像向所有的用户都发了一份“推恩令”,让所有有意愿进行开发的人都可以轻易地进行开发。如此一来,无论是在哪个领域,都可能产生大量的开发者,原来依托于某些技术力量而占据垂类市场的优势就会荡然无存。

OpenAI为何痛下杀手?

很多开发者在社交媒体上抱怨OpenAI痛下杀手,但如果我们客观分析此事,就不难发现这其实并非Ope-nAI的主观所为,而只是一次无心的误杀——就好像一只大象在行进中顺便踩死了一群蚂蚁一样。

事实上,如果站在OpenAI的角度,它现在根本没有空去真正关心开发者们的存亡,因为虽然它表面光鲜,但其实它面临的问题也不少。

众所周知,OpenAI是由马斯克、阿尔特曼等人在2015年创办的。最初,它的定位并不是一家商业公司,而是一家非营利的研究机构。不久之后,马斯克就因发展理念问题退出了董事会,OpenAI也在阿尔特曼的推动下转型成为了一家营利公司。然而,当时的OpenAI既没有雄厚的资本,也没有成型的产品,发展可谓举步维艰。就在这个时候,微软以“救世主”的形象出现了。它不仅向OpenAI投入了数十亿美元的资金支持,还为其提供了强大的算力支持。正是这些财力和物力,让OpenAI有了训练包括GPT在内的大模型的能力。但作为回报,OpenAI也向微软出让了49%的股份、未来部分利润的分红,以及其技术的优先使用权。

在外人看来,微软和OpenAI的合作可谓是天作之合,尤其是对OpenAI来说,可以背靠微软这棵大树,风光无限。然而,现实并非如此。微软优先得到了OpenAI训练的GPT模型之后,就将它集成到了必应搜索、Office365等产品中,还将AI能力通过Azure云进行输出。这一波操作下来,微软赚得盆满钵满,但OpenAI并没有从中分得多少好处。而且微软还利用它在终端市场的触达优势,抢走了一大批OpenAI的客户。比如,摩根士丹利曾经是OpenAI的“旗舰客户”,但最近,它已经开始从微软的Azure云购买部分OpenAI的模型服务。

很显然,作为一家营利公司,Ope-nAI是很难容忍微软的这种“挖墙脚”行径的,即使它是自己最大的金主、表面上最坚强的合作伙伴。然而,对于微软,OpenAI其实也无可奈何。毕竟,无论是资金实力、市场知名度,还是市场触达,现在的OpenAI都难以和微软相比。更何况,微软本身其实也有很多能力不俗的大模型。一旦OpenAI停止与其合作,微软就可以用这些模型替代掉GPT。虽然这些模型从性能上可能不如GPT,但考虑到微软在产品生态,以及用户触达等方面的优势,OpenAI可能并没有必胜的把握。

在这样的情况下,和微软翻脸单干显然不是上策,更为可取的思路是绕开微软,建立一个属于自己的生态以及与之对应的商业模式。可以看到,这次OpenAI推出GPT商店,并发布GPTs和Assis-tantsAPI,就是试图突破微软渠道控制,夺回对自己模型控制权的一次努力。

从移动互联网的经验看,应用商店可谓是非常赚钱的买卖,例如苹果的应用商店。不过,一个应用商店要能够赚钱,就必须以足够多的用户和开发者数量作为基础。怎么才能迅速培养足够多的开发者呢?最好的办法当然是提供更为好用的工具,从而把开发的成本尽可能地降下来。而这应该就是GPTs和AssistantsAPI背后的产品逻辑。

另外一点不太被人们注意的是,GPT应用商店的推出可能还有一个不足为外人道也的动机,即用另一种方法把失去的客户从微软手里夺回来。如前所述,现在的微软正凭借其在Azure云等方面的优势抢占OpenAI的客户。但这些被抢走的客户主要是用AI来做什么呢?除了一小部分是直接自用之外,很多客户其实是用它们来套壳做各种各样的AI产品。如果有了GPT应用商店,即使这些客户再也不回来了,它们也有可能将自己的产品挂到GPT应用商店里面进行出售。这样,OpenAI就依然可以在这些流失的客户身上获得收入。

OpenAI能复现“iPhone时刻”吗?

如此看来,OpenAI目前的举动确实是模仿苹果而得出的一手妙招。也正因为这个原因,所以现在网上有不少人将OpenAI的此次开发者大会称为AI的“iPhone时刻”。这个评价确切吗?

如果这里的“iPhone时刻”仅仅是指OpenAI模仿了苹果的商业策略,那这一称呼可谓十分确切。不过,如果“iPhone时刻”指的是在此之后,它就可以像当年的苹果生态一样,实现GPT生态的极大丰富,同时带动OpenAI自身收入的疯涨,那么这就可能需要进一步的观察和验证。

在解释这一点时,我们需要重新复盘一下“苹果税”模式成功的关键。在我看来,“苹果税”模式之所以能成功,重要的原因有两点:

第一点是对渠道的绝对垄断。苹果的iOS系统是封闭的,苹果应用商店是应用进入系统的唯一渠道。因此,iOS上的开发者只要想用应用来赚钱,“苹果税”就是难以逃避的。而如果对渠道的绝对垄断这一点条件不满足,那么“苹果税”就很难得到保证。

这一点,我们对比一下安卓就知道。大多数读者可能只听过“苹果税”,没听过“安卓税”,但其实安卓也是会对从GooglePlay商店上架的应用收费的,并且其抽成比率要比苹果更高,只不过是针对游戏等少量的应用。如果排除掉iOS系统中不交“税”或享受免“税”的应用,苹果真正能收到“税”的其实也只是游戏等少数的应用。而考虑到安卓系统中的应用总量要比苹果高得多,“安卓税”的潜在“税基”可能并不会比“苹果税”少。但是,现实的抽成结果呢?谷歌得自应用商店的收入不到苹果的一半。最重要的原因就是,在安卓这样的开放系统下,开发者可以很容易地绕开GooglePlay发布自己的产品,并绕开安卓内置的支付渠道进行应用内购买。这样,“安卓税”的收入当然就难以和“苹果税”匹敌了。

第二点就是让开发者确实可以赚到钱。根据苹果方面公布的数据,仅2022年,苹果商店就为开发者创造了1.1万亿美元的销售额,这个数字是十分可观的。

苹果之所以能做到这一点,很重要的是它处理好了生态中的竞争烈度。

经济学家菲利普·阿吉翁在《创造性破坏的力量》(ThePowerofCreativeDestruction)一书中讨论过创新和竞争的关系。他指出,只有当创新者可以从创新行为得到一定的回报,即“创新租”(innovationrent)时,他才有创新的动力,而这要求在创新后的一段时间内,他可以取得一定的垄断权。

对比阿吉翁的上述理论可知,苹果在构筑生态时,其实是非常好地拿捏了竞争的分寸。一方面,它提供了很好的开发和运行生态,从而让足够的开发者可以进入到生态当中。另一方面,苹果依然对开发者设置了适度的门槛。比如,它专门为开发者提供了为其系统编写应用的专业语言swift。当使用这一语言为苹果生态开发应用时,可以比用传统的编程语言具有更高的效率,但它依然需要一定的学习门槛,并且由于其是苹果开发专用,因而还可以培养开发者对苹果生态的忠诚度。此外,当应用上架苹果商店时,还需要经过审核。通过这些手段,苹果就可以对生态中的竞争烈度进行很好的调控,从而保证上架苹果商店的开发者们确实可以从中赚到钱。

通过简单的对比,我们就不难发现,至少在目前,OpenAI并不具备以上两个类似苹果的成功条件。

一方面,它对于AI应用分发渠道的控制其实并没有那么有力。虽然从理论上讲,GPT应用商店可能会在未来成为开发者们分发其产品的一个重要渠道,但它显然不可能是唯一的渠道。

另一方面,它可能也很难保证开发者营利的能力。恰恰相反,正如我们前面看到的,它的GPTs和AssistantsAPI正在“毁掉”开发者们。如果开发者们自己都难以赚到钱,又从何指望它们可以缴纳“OpenAI税”呢?

从这个角度看,现在就说本月的开发者大会是又一个“iPhone时刻”,将成为OpenAI营利能力的转折点似乎还为时过早。

AI创业者们何去何从?

那么,当OpenAI用灭霸的响指一下子毁掉了大批AI创业者的梦想之后,广大AI创业者又应该何去何从呢?在我看来,现在的当务之急还是应该要重新梳理创业的逻辑。

在互联网时代,关于互联网和具体产业的关系曾有一个争论:究竟应该是“互联网+行业”,还应该是“行业+互联网”——其中,前者是以互联网逻辑为主,将它应用到具体的行业,而后者则是以行业逻辑出发,在此基础上应用互联网技术来进行赋能。从后来的结果看,虽然两种思路都有成功的案例,但相比之下,后一种思路的韧性似乎更强一些。这一个现象是非常有启发性的。

自从ChatGPT带动了生成式AI爆火之后,很多行业已经开始将AI应用到了自己的业务中。但是,目前它们更多只应用在一些相对边缘的业务,如客服、文书的处理等。相比之下,AI对核心业务的改造和影响依然有限。也就是说,目前的AI应用大致上侧重于“AI+行业”,而“行业+AI”则很不足。

为什么会这样呢?其关键就在于AI的开发者其实很难深入到某个行业内部,了解这些行业的运行逻辑。与此同时,行业中的企业出于保密的需要,也不愿意将自己的内部信息和数据,以及具体的使用需求提供出来训练AI。

很显然,对于各个行业来说,“行业+AI”都有巨大的需求,因此如果可以钻研一下这一块需求,或许可以找到很多商机。

具体来说,针对企业私有云的AI智能体的提供就可能是一个热点。虽然企业可能希望在核心业务应用AI,但一方面,出于泄密的担忧,它们可能不愿意和ChatGPT或其他公有云上的AI交互;另一方面,它们可能还有一些基于行业的特殊交互需求。因此,简单的套壳GPT并不能适应它们的需求,它们需要的AI依然需要专门提供。

除了深入行业之外,AI产生的问题也可能产生巨大的商机。例如,当生成式AI越来越普及后,如何判断内容的真伪就成为了一个问题;又如,随着AI的普及,数据的互动会越来越频繁,这样数据安全也会面临更多的挑战……我想,只要可以破解这些问题中的任何一个,都可能得到非常巨大的回报。

当然,如果没有能力做上述的任何一件事,也没关系。大不了安安心心做GPTs,然后在GPT商店上交易。虽然这看起来没啥技术含量,但如果可以做出特色,可能依然能赚钱。

 

《比较》研究部主管