
神秘面纱终揭晓:Whisper Thunder原来就是Gen-4.5
各位开发者朋友们,还记得那个在Artificial Analysis榜单上神神秘秘的Whisper Thunder(代号David)吗?今天,它终于露出了庐山真面目——没错,就是Runway最新发布的Gen-4.5!这可不是普通的更新,而是视频生成领域的一次大地震。作为当前SOTA(最先进)视频模型,Gen-4.5在运动质量、提示词遵循度和视觉逼真度方面,直接给行业立了个新标杆。
榜单霸主:ELO分数碾压全场
先来看看数据说话:Gen-4.5在Artificial Analysis的文本生成视频基准评测中,拿下了1247的ELO分数,稳坐榜首宝座。什么Veo 3/3.1、Kling 2.5、Sora 2 Pro,通通被甩在身后。这意味着,在视频生成的竞技场上,Gen-4.5已经成了那个“别人家的孩子”,不仅成绩好,还创意无限。Runway这小团队,硬是靠着技术实力,让整个AI社区都竖起了大拇指。
进化之路:从Gen-1到Gen-4.5的华丽转身
回顾一下Runway的成长史,简直是一部励志大片。2023年2月,Gen-1横空出世,成为首个面向公众的视频生成模型,开创了全新的创意表达方式。7月,Gen-2率先支持文生视频+图生视频,比Pika和Sora都早,从此一路领跑行业。如今,Gen-4.5不仅保持了Gen-4的速度与效率,还在预训练数据效率和后训练技术上取得重大突破,把视频生成的前沿又往前推了一大步。
核心特性:精准、逼真、创意无限
### 精确的提示词遵循能力
Gen-4.5可不是那种“你说东,它往西”的模型。它在物理准确性和视觉精细度上达到了前所未有的水平——物体的运动有真实的重量感,液体流动符合动力学,连发丝和材质纹理这种微小细节都能在运动和时间维度上保持一致。想象一下,你输入“一只北极熊坐在透明冰块里”,它就能生成电影级的逼真画面,还能让摄像机流畅跟随,这精准度,简直让人怀疑是不是偷偷装了物理引擎!
### 风格化控制与视觉一致性
从照片级真实感到风格化动画,Gen-4.5都能轻松驾驭,而且视觉语言统一连贯。无论是日常场景的“生活切片”,还是充满情感张力的“电影质感”,它都能以高精度呈现。比如,生成一个90年代卡通狗的场景,手伸进来关掉电视,摄像机下移揭示“Runway”写在麦片碗里——这种细节把控,让创作自由无限放大。
部署与局限性:技术背后的现实考量
Gen-4.5基于NVIDIA架构构建,全程运行在NVIDIA GPU上,从训练到推理都优化得杠杠的。不过,它也不是完美无缺,视频生成模型的通病它也有:因果推理有时会“倒置”(门没开就先开了),物体永久性可能出bug(杯子突然消失),动作成功偏差(踢球不准也能进)。这些局限性在世界模型研究中挺关键,Runway表示正在积极解决。
结语:视频生成的新时代已来
Gen-4.5的发布,不仅是一次技术升级,更是创意工具的一次革命。它以相近的价格提供全球领先的视频生成能力,让不同规模的创作者都能玩转AI。开发者们,是时候拿起这个新武器,去探索那些以前不敢想象的视觉世界了!更多详情,可以查看官方博客:https://runwayml.com/research/introducing-runway-gen-4.5。
登录后参与讨论
加入社区,与大家分享您的独特见解。
立即登录