7月6日,在2024世界人工智能大会期间,快手举办了以“新AI·新应用·新生态”为主题的大模型论坛,会上,快手大模型首次集体亮相,视频生成大模型可灵、图像生成大模型可图等产品的多项新功能正式发布。
继图生视频、视频续写功能发布之后,可灵在一个月内迎来了第三次重大升级,网页端(https://klingai.kuaishou.com)也正式上线。
在本次论坛上,可灵推出更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能,同时,创作者单次生成的文生视频时长增加至10秒。图像生成大模型可图则宣布正式开源,这一举措旨在激发行业活力,共建一个更为繁荣的文生图大模型社区生态。
一直以来,AI技术创新都是推动快手发展的驱动力,不仅覆盖内容生产、理解、推荐等多个层面,也持续推进着快手商业生态的智能化经营水平。快手高级副总裁、主站业务与社区科学线负责人盖坤表示,快手未来将继续加大在AI领域的投入,大力推动技术创新,“坚定地为用户做最好的AI技术”。
快手大模型首次集体亮相,用AI重塑内容理解、分发与生产环节
盖坤介绍,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵,覆盖内容理解、分发、生成等多个层面,并深度服务快手的商业生态场景。其中,快手的推荐大模型SIM,凭借十万亿参数的规模,成为全球领先的推荐系统之一,其下一代架构ACT预计每日将为快手App增加4亿分钟的用户观看时长,显著提升用户粘性和活跃度。
“坚定大模型技术投入与创新,坚持在真场景中挖掘真价值,满足用户的真需求”。快手副总裁、大模型团队负责人张迪表示,将用大模型技术重塑快手业务,通过“升级理解、创新互动、探索生成”,在内容生产方面,打造“新一代AIGC创作、素材工具”和低门槛、智能化的内容生产体验;在内容消费领域,升级快手的内容理解和分发体系,提升用户的消费体验。
据「TMT星球」了解,基于快意大模型构建的视频脚本生成,直播实时脚本生成、广告线索客服,叠加数字人技术,助力商业化广告主低成本生成高品质的视频和直播内容,提升线索转化效率。快手的AIGC营销素材在今年6月达到了单日消耗峰值突破2000万的里程碑,展示了大模型在商业场景中的巨大潜力。
快手商业化外循环和AI商业产品负责人刘逍透露,半年来,有近2万商家在快手平台借助大模型能力实现智能化经营,获得不菲回报。相比今年1月,今年6月的AIGC月活跃客户数增长了8倍,月GMV规模提升了64倍,平台AIGC广告收入规模提升了12倍。刘逍表示,磁力开创、女娲数字人、π数字员工等“新生意”工具将持续为商家深度赋能,“我们将继续深化AI技术在商业化中的应用,不断创新和发展,为客户创造更多价值。”
可灵AI推出Web端,上线首尾帧控制、镜头控制等新功能
继图生视频、视频续写功能发布之后,可灵AI在一个月内迎来了第三次重大升级,网页端也将正式上线。在本次论坛上,快手宣布,可灵AI基础模型再度升级,推出更加清晰的高画质版,以及首尾帧控制、镜头控制等全新编辑能力,同时,创作者单次生成的文生视频时长增加至10s,是业内对用户开放使用可实现的最长时长。
作为全球首个真正用户可用的视频生成大模型,可灵于6月6日正式发布文生视频功能,随后又于CVPR会议期间推出了图生视频、视频续写等多项新功能,支持用户最长生成约3分钟视频。可灵以真实世界物理规则为基准,生成的视频展现出了电影级别的画质与动态效果,甚至能够模拟大幅度的物理运动,打破了传统视频生成技术的局限。这一突破性成果,不仅在国内收获了用户的广泛好评,更在海外引起了巨大反响,引发了全球对中国AI技术发展速度的广泛关注与讨论。
盖坤介绍,截至目前,已有超过50万用户申请可灵的内测资格,视频生成数量达700万。用户通过“可灵”创造的“老照片复活”等作品,因为触动人心的力量火爆全网。快手也将继续致力于提升模型基础质量,增强画质清晰度,并引入更多创新功能,以满足用户多样化需求。
快手视觉生成与互动中心负责人万鹏飞表示,可灵AI大模型最新发布的版本中,可灵在运动生成、生成时长、物理规律、视频画质、指令响应、图生视频、视频可控性等七个方向的能力亮点实现进一步升级,可单次生成更高清更可控的10s及更长的视频。
值得关注的是,国内首部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》预告片还在会议期间惊艳亮相,可灵为该剧提供深度技术支持。AIGC技术的迅猛发展,为短剧产业注入了全新的活力。张迪指出,利用AI技术可大幅度提高短剧生产、制作和运营的效率,“可能半年以前,大家都没法想象真正用AIGC来制作电影,(现在它)来了!”
此外,为了进一步激发AI爱好者们的创作热情,快手还在论坛上正式发起“灵”感迸发——首届可灵AI x 快影视频创作大赛,联动六大顶尖院校,总奖金池超30万元。大赛还特别推出“可灵AI x 星芒短剧”创作者孵化计划,各专题一等奖获得者将受邀加入创作者扶持计划,有机会获得重磅流量及现金奖励、与行业专家进行面对面交流。
可图正式开源,将共建更繁荣的文生图大模型生态
在图像生成大模型领域,快手的可图同样处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、摄影级的画面质感、多条件的可控风格化生成等。在权威机构智源研究院的测评中,可图以75.23分位居文生图大模型领域全球第二水平。
盖坤介绍,可图大模型集成了快手在大语言模型领域的深厚积累,通过数十亿中文语料的训练,成为最懂中文的文生图模型,其综合性能超越了SDXL/SD3等开源模型以及Midjourney等闭源模型,树立了中文场景下图像生成的新标杆。本次论坛上,快手宣布可图将正式开源,这一举措旨在激发行业活力,共建一个更为繁荣的文生图大模型社区生态。
会上,中国计算机学会(CCF)还宣布与快手携手,共同成立“CCF-快手大模型探索者基金”,并同步开启基金申请通道。该基金计划于年内推出12个研究项目,课题最高可获30万元支持,旨在应对AI技术迅猛发展的趋势及业界对前沿技术的迫切需求,聚焦新一代大模型的关键技术研发。
面向未来,盖坤表示,快手将继续加大在AI领域的投入,大力推动技术创新,“坚定地为用户做最好的AI技术”。