大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

3个月9次迭代,快手可灵AI面向全球发布1.5模型

TMT星球 2024-09-20

9月19日,可灵AI迎来重磅升级,视频生成新增可灵1.5模型,在画质质量、动态质量、美学表现、运动合理性以及语义理解等方面均有显著提升。与此同时,可灵AI还引入了全新的“运动笔刷”功能,进一步提升视频生成的精准控制能力。

首先是基座模型再次升级,新增可灵1.5模型,支持在高品质模式下,直出1080p高清视频,挑战大屏清晰度与质感。与可灵 1.0 模型相比,1.5模型在画面质量、动态质量、文本响应度等方面有显著效果提升,其内部评测整体效果提升95%。

此前,可灵1.0模型在高品质模式可生成720p视频,本次升级后,1.5模型高品质模式可直接生成1080p高清视频。通过输入提示词“女孩看着车窗”,对比左右两个版本视频生成的效果,可以发现,可灵1.5新模型的画面质量提升显著:画面清晰度有直观可感,画面右侧的女孩面部细节更清晰丰富,车窗的水雾、整体光影表现等也都更加出色。同时,新模型下画面整体构图也进一步优化,画面更具美感。

在动态质量方面,新模型也有显著提升。例如,对比可灵AI此前火爆出圈的吃面案例,输入提示词“小男孩吃面”,右侧1.5模型生成的视频中,面条从被夹起到入口这一过程中,在弹性、垂坠感等方面有非常真实的物理表现,同时小男孩右手握住筷子和吃面时的咀嚼动作,也都较左侧1.0模型更加自然流畅,整体运动合理性大大增强。

在图生视频方面,可灵全新的1.5模型可以响应更复杂的文本描述要求。例如通过一张没有人物的食物照片和提示词“镜头拉远,一个小男孩走到桌前拿起勺子开始吃饭”。在生成的视频中,随着镜头的微微晃动,一个勺子“入场”,然后画面聚焦到握着勺子的小男孩,看他将一勺饭菜送到嘴里,勺子在碗里拨开饭粒的细节也都被细致地呈现了出来,显示出强大的图生视频理解能力。

本次升级,可灵AI还带来了强大的“运动笔刷”功能,大幅提升了图生视频时创作者对运动效果的控制能力。“运动笔刷”功能支持为图片中的元素(人或物体等)指定运动轨迹,用户只需将图片中需要控制运动方向的部分勾勒出来,然后画一个示意运动方向箭头,就可实现精准运动控制。该功能支持上传图片后最多为图中的 6 个元素(人或物体等)指定运动轨迹。此外,还可以为某些元素额外指定静止区域,让视频内容有更好的运动控制及运动表现。

目前,横屏(16:9、4:3)、竖屏(9:16、3:4)、方屏(1:1)等多种尺寸格式的图片,都支持使用「运动笔刷」生成视频,生成视频时长为5秒。大量用户和媒体的评测显示,可灵AI的运动笔刷功能,在易用性、效果表现等方面均为业内领先。

实际上,可灵AI近期还进行了一系列其他功能升级,诸如支持一次性生成最多 4 条视频,方便创作者快速选取到最优生成结果;“图生视频”功能新增支持 10 秒时长并在标准模式下支持增加尾帧;“AI图片”功能支持“画质增强”。此外,官方还上线了使用指南,帮助用户更好地掌控可灵AI。

据「TMT星球」了解,自今年6月发布以来,这已经是可灵AI累计第9次迭代升级。本次升级也将同步面向全球展开,今年7月,可灵AI宣布国际版1.0正式上线,正式面向全球用户开放,随后又推出了全球会员体系。

目前,可灵AI已经累积了大量的国内外用户,快手高级副总裁、主站业务与社区科学线负责人盖坤此前在快手投资者日上披露,已有累计超260万人使用过可灵AI,并累计生成超2700万个视频、5300万张图片。

从《芝草无根》看百年古村蝶变,兴趣电商让更多乡村被“看见”
发布 | 大力财经数字时代,当手机成为新“农具”,直播成为新“农活”,乡土中国将被如何重塑?为探寻答案,中国社会科学院社会学研究所研究员田丰带领团队,于2021年走进贵州省铜仁市德江县共和镇焕河村,围绕抖音账号@黔东农仓 创始人丁浪,展开了为期半年

2024-12-16

这届年轻铲屎官,宁愿豪掷上万给猫狗治病,也不买17元的宠物保险
文 | 螳螂观察作者 | 青月这几天气温断崖式下跌,我头一件事就是给家里的狗狗安排上更厚的毛衣和取暖器,怕毛孩子被冻着是一方面,但更重要的是,我的钱包再也经不起折腾了。去年刚入冬的时候,因为早晚温差太大,家里那两只小狗都没能扛住,纷纷感冒了。我心

2024-12-13

360智脑张向征:共建可信可控AI生态 应对大模型安全挑战
发布 | 大力财经人工智能的加速发展,有力推动了社会的数智化转型;与此同时,带来的相关安全风险也日益凸显。近日,在北京市举办的通明湖人工智能开发与应用大会上,360智脑总裁张向征以“大模型安全研究与实践”为主题,向业界分享了大模型安全领域的最新研

2024-12-13

卫生巾品牌集体塌房,我们还能依靠谁?
卫生巾行业遭遇信任危机

2024-12-13