乐鱼体育国际登录:
8月22日,可灵AI推出根据2.1模型的全新首尾帧功用。该功用经过晋级端到端多模态语义推理才能,提高了首尾帧视频生成作用。据评测数据,与1.6版别比较,作用提高235%,在视频转场、视觉出现、运镜处理及营销资料制造等方面体现杰出。

可灵2.1模型首尾帧功用的中心改进之一,是改进AI视频生成中常见的转场问题,如场景联接僵硬、有“刹车感”等。
测验视频显现,一名年青亚洲女人从堆满书本与佛像的房间回身,镜头推动至金色装修渐多的空间,进程中人物发型(长发天然垂落转为侧梳)、服装(白色长袖衬衫变为无袖上衣)、光线(暖光由散射转为聚集)完结无缝联接,场景切换逻辑连接。该事例经过多个首尾帧相接完结接连转场,体现了模型对艺术风格切换与人物动态联接的把控才能。
实测视频中,人物概括在深蓝布景中逐渐变为火焰形状,火山岩浆活动、星空下烈焰升腾等细节明晰,节奏与风险严重的气氛匹配,显现出模型对杂乱视觉元素的控制才能。
可灵2.1首尾帧功用支撑专业级杂乱运镜,经过首尾帧接连联接,完结镜头轨道与场景逻辑的匹配。
例如,在模型接连生成的视频中,镜头先快速向左下摇镜,杰出趴在地上匍匐的寒酸机器人,随后快速左摇,拍照窜逃机器人与爆破场景,整个镜头调度流通连接,提高了观看的沉溺感。
晋级后的首尾帧功用可快速生成契合品牌调性的构思展现视频,适用于市场营销等范畴,有助于下降资料制造本钱。
在一个饮品广告事例中,易拉罐从树莓中快速飞出,周围树莓如爆破般散开,果汁向四周飞溅,进程天然,给观众带来沉溺式体会。
这一体现得益于可灵2.1在端到端优化的多模态语义推理才能上的提高。模型能深度整合用户提示词与首尾帧图片中的视觉语义及动作目的,交融多模态数据,捕捉并推理画面元素在时空维度上的演化逻辑,在艺术风格切换、人物联接、杂乱运镜与场景搬迁等方面,生成天然流通的动态画面。
一起,可灵2.1引进自适应分散引导与方向重定向机制,在分散生成的每一步对条件散布进行动态引导和纠正,批改违背语义或视觉逻辑的动态途径,保证动作联接滑润、运动节奏安稳可控。
此外,模型在生成进程中坚持人物/物体身份一致性、颜色风格与画面基调连接,提高了视频的专业质感。面临高动态场景下的部分失真、细节破碎、缩放变形及首尾帧视觉跳变等问题,该机制能有用按捺和纠正过错,保证生成内容的安稳性。
作为AI构思生产力渠道,可灵AI已完结30次迭代,服务用户超4500万,累计生成视频超2亿条、图片超4亿张,掩盖广告、影视、游戏等多个职业。此次2.1模型首尾帧功用的推出,提高了视频生成的一致性和安稳才能,适用于广告营销、影视、短剧、动画等构思制造场景,进一步稳固了其在AI视频生成范畴的位置。