设为首页     加入收藏
首 页 财经要闻 证券分析 金融国际 股票产权 基金定投 理财投资生活消费 汽车行业 房产行业
您当前的位置:首页 > 科技 >正文

魔搭社区上线AI视频生成工具Live Portait,可一键让照片开口说话

2023-08-16 14:23:27 来源:马超

 阿里云在生成式AI领域又有新进展。8月16日消息,阿里云推出数字人视频生成工具Live Portait,上传一张照片和一段文本或语音即可生成一段开口说话的数字人视频,可应用于视频直播、聊天机器人、企业营销等场景。目前,该工具已在魔搭社区创空间开放体验。

 

自对话大模型和AI绘画模型相继火热后,业界对生成式AI的研究逐步朝更多模态的方向演进,AI视频生成便是热门技术之一。该技术可将文本或音频等信息转换为面部运动信息,进而驱动生成照片人物形象的动画,能有效降低视频拍摄和制作门槛。

此次上线的Live Portait工具由运动模块和生成模块组成,其采用阿里云自研的口型预测算法,生成的口型准确度相比传统方法大幅提高;在训练阶段,增加了姿态的显式控制,无需底板视频也可以生成任意动作的视频,大幅提升数字人说话的真实感;此外,通过眼神主动控制技术,Live Portait可以为眼球增加一些自然运动,使得生成结果在观感上更接近真人效果。据介绍,Live Portait相关技术已被CVPR、ICCV等国际AI顶会收录。

 

根据魔搭社区上的信息显示,在Live Portait上传照片后,用户可选择文本驱动和音频驱动两种方式,文本驱动模式下,该工具提供了普通话、英语、粤语、童声等28种声音。此外,Live Portait还提供了轻量模型选择,帮助用户更快速生成视频。

该工具算法负责人张邦表示:“ Live Portait集成了团队多项自研创新技术,例如仅需单张图片就能生成逼真的面部动画,突破了传统对抗生成网络的局限。随着技术的进一步迭代,图生视频有巨大的应用空间,有望成为企业降本增效的生产工具。”

据悉,该团队研究方向涵盖数字人、3D模型AI生成、高真实感渲染、自然人机交互等领域,目前已发表50多篇国际顶会论文。

  声明:转载上述内容属于广告或出于传递更多信息之目的,不代表东方财经网的观点。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自负。

关于我们 - 品牌推广 - 免责申明 - 会员注册 - 联系我们
东方财经网属于非盈利网站,转载上述内容,不表明证实其描述,仅供投资者参考,并不构成投资建议。投资者据此操作,风险自担。

版权所有·东方财经网 [粤ICP备15076225号] 粤公网安备 44010502000470号