短视频全由AI生成,颠覆“抖音”的短视频应用Sora来了

2025-10-09 13:36

只需输入一段文字描述,AI大模型Sora 2就能将其生成为电影级效果的短视频,由其驱动的短视频创作应用“Sora”,也在ios美区商店持续“霸榜”。

9月30日,AI大模型龙头公司OpenAI发布最新音视频生成模型Sora 2,其官方发布稿称,Sora 2相较此前模型在物理上更准确、更逼真、更可控,它还具有同步对话和音效的功能。由Sora 2驱动的Sora也在当天登陆美区苹果商店,10月3日至今,Sora一直占据免费应用下载榜第一位。

文字一键生成视频,更加真实也更加聪明

2024年9月,OpenAI发布了Sora 2的上一个版本,用户可以使用文本、图像或其他视频生成长达20秒的视频,OpenAI将其称为视频的GPT-1时刻。该公司称,从那时起Sora团队就一直专注于训练具有更高级模拟真实世界能力的模型,这需要以大规模视频数据为基础,进行预训练和后训练。

OpenAI在官方文档中表示,相比上一代的模型,Sora 2可以生成更为复杂、更具真实感的视频:包括奥运体操运动员式的动作,一名运动者在桨板上进行后空翻,准确呈现现实世界中浮力和刚度的状态,以及一位花样滑冰选手头顶一只猫完成三周半跳。官方文档进一步解释,此前的大模型为了执行文本给出的指令和描述,会扭曲物体和现实世界,例如,当篮球运动员投篮未中时,球可能会凭空传送到篮筐。而在Sora 2中,若球员投篮未中,球会从篮板反弹。

在音响效果和风格方面,Sora 2作为一款通用音视频生成系统,它能够创建高度逼真的复杂背景音景、语音及音效,Sora 2也更擅长呈现写实风格、电影风格和动漫风格的视频。

在苹果商店上架的Sora App采用类似抖音、快手的竖屏短视频流形式,用户可浏览、点赞、评论AI生成的视频,用户也可通过文字提示、图片、Cameo(客串)或Remix(混剪)功能生产并分享视频。值得注意的是,Sora App所有视频都是由AI生成的,对用户上传的素材、文字提示的内容有较严格的限制。目前,Sora仍然采取受邀注册机制。

据媒体报道,Sora应用上线苹果商店后,上线首日就迅速实现约5.6万次安装,迅速攀升至美国App Store“整体应用榜”第3名。到10月3日,其排名已升至第1位。这一强劲势头使Sora的首发表现超越了其他主流AI应用的推出初期表现,包括Anthropic的Claude和微软的Copilot,并与埃隆・马斯克旗下xAI推出的Grok应用推出时的表现相当。

根据OpenAI发布的Sora 2提示词指南,创作者可以给大模型一段模糊的文字提示,大模型会即兴发挥生成视频,创作者也可针对镜头、灯光或动作提出具体细致的要求,大模型则会严格执行这些指令生成视频,就视频生成效果而言,两种方法可谓各有千秋。

视频生成领域的GPT-3.5时刻

对于Sora 2的发布,OpenAI将其称为视频生成领域的GPT-3.5时刻。市场分析认为,Sora从模型迈向社交平台,有望重塑创作者内容生态,对于AI基础设施而言,则有望进一步拉动算力、存储需求。

华鑫证券研报认为,Sora2模型的在物理真实感、视频时长、音视频同步、跨镜头连贯等技术上的飞跃有望推动应用端的实用性、可玩性,同时,本次OpenAI把Sora2 App直接打包成面向大众的社交产品也是AI视频创作消费级应用的一次较好尝试,每一次技术的进步均有望带来时代的红利,AI已不再是“辅助”,而成为新成本曲线与盈利曲线的起点,打造AI时代消费级头部应用将成为各家企业争相布局方向。

民生证券研报认为,以Sora2为切入点,OpenAI或将形成以“内容平台激发需求(Sora)—支付渠道保障(Stripe)—电商平台供给商品(Shopify/Etsy)”的商业模式闭环,通过“代理商务协议”(Agentic Commerce Protocol,ACP)构建 AI 时代的全新商业模型。用户的电商购物行为自然可能转向 AI 驱动的“对话式购物”,随着商家覆盖与支付能力的进一步扩大,“对话式购物”或许能颠覆传统电商流量分配规则。

东莞证券研报则认为,Sora 2在视频生成能力上实现重大突破,有望进一步拉动算力与存储需求。视频模型质量提升往往以更大的模型、更长序列或更多训练数据为代价,直接增加训练与推理算力需求;存储方面,高质量、长时长的视频数据本身体积庞大,模型训练需处理海量视频-文本配对数据集,对存储容量和I/O带宽要求极高,随着Sora 2推向应用后,用户生成的每一条视频都会产生大量数据,显著提升对云存储和分发带宽的需求。

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。
从业10余年,2012年加入《经济观察报》,不敢妄言新闻理想,但求专注、专业。