♡
↗
📋
36kr
📅 02/08 15:50
GOOG.O AMZN.O
之前有张「中国AI vs 美国AI」的图很火,就在OpenAI和Anthropic齐发新模型的同时,元宝和千问正在开打红包大战,对比起来讽刺性拉满了。 但这个笑话的保质期很短,也不怎么好笑了,因为很快赶上了字节和快手同样先后的发了新一代视频模型,在外网刷屏的程度再次引起洋人对于中国AI实力深不可测的「刻板印象」。 所以说钱钟书老爷子写「围城」是有道理的,寰宇就是一个围城,里头的人眼馋外边,外边的人...
之前有张「中国AI vs 美国AI」的图很火,就在OpenAI和Anthropic齐发新模型的同时,元宝和千问正在开打红包大战,对比起来讽刺性拉满了。 但这个笑话的保质期很短,也不怎么好笑了,因为很快赶上了字节和快手同样先后的发了新一代视频模型,在外网刷屏的程度再次引起洋人对于中国AI实力深不可测的「刻板印象」。 所以说钱钟书老爷子写「围城」是有道理的,寰宇就是一个围城,里头的人眼馋外边,外边的人羡慕里头。 字节的Seedance 2.0很牛逼,可以说是完全改写了视频生成的方法,而且因为字节这家公司自带的外围声量一直很大,所以虽然发布更晚,评价增长却更快,但快手的Kling 3.0也非常强,我已经烧掉三个号了,保证绝对不是在强行塑造「双星闪耀」的概念。 这也和两个模型的路线差异有关,综合能力肯定都要对标视频大模型的Sota、也就是谷歌的Veo模型,但Seedance 2.0更侧重于Sora 2的那套运镜、理解、模仿、转场等效果,极大的利好短视频创作者生态,而Kling 3.0则更偏向于Runway代表的影视化、真实化和工业化的能力,是冲着专业导演和工作室去的。 所以博主和用户天然会对Seedance 2.0更有感觉,这没毛病,但我对Kling 3.0的上限期待很高,它真的是在抹平真实和虚拟之间的界限,不过从长期来看,路线差异必然是暂时的, 最后大家都会殊途同归,解决抽卡问题的同时,全方位无死角的替代掉现有视频生产管线的一半以上,甚至更多。 相比「闷声发大财」的AI Coding,多模态才是AI接近普通人的破圈手段,去年ChatGPT和Gemini的两次「翻倍级」增长,一个是因为GPt-4o的「吉卜力风潮」,一个是基于Nano Banana的降维打击,都是多模态在立功。 到了今年,战场开始继续前移,除了Seedance 2.0和Kling 3.0,同样是在这个月,马斯克发布了Grok专有的视频模型Imagine 1.0,谷歌也发布了打掉游戏引擎市值的Genie 3,发现共同点了吗? 全,是,视,频。 人是视觉动物,所见即所得的信息量,是远超文本和语言的,视频模型以前主要吃亏在能力不足,训练难度居高不下,生成质量良莠不齐,无法形成类似「一键P图」的稳定性玩法,但是到了2026年,这个瓶颈期目测已经快要跨过去了。 还记得威尔·史密斯吃意大利面吗?那也不过是两三年前的事情,...