腾讯云推出2D真人小样本数智人
发布时间:2023-04-27 11:12:56 所属栏目:动态 来源:
导读:通过腾讯数智人的支持,数字经济学者刘兴亮以短视频“亮三点”为例,展示了他的首个数智人分身。
“这个形象近似真人,表情、唇型匹配自然,包括我的特色口音也模拟得惟妙惟俏的数智人,正是腾讯云
“这个形象近似真人,表情、唇型匹配自然,包括我的特色口音也模拟得惟妙惟俏的数智人,正是腾讯云
通过腾讯数智人的支持,数字经济学者刘兴亮以短视频“亮三点”为例,展示了他的首个数智人分身。 “这个形象近似真人,表情、唇型匹配自然,包括我的特色口音也模拟得惟妙惟俏的数智人,正是腾讯云智能小样本数智人。未来,不需要搭建拍摄场地,无需提前化妆布置,不受空间、时间的限制,数智人随时随地都能帮我生成播放视频,让我的生产效率得到提升。”刘兴亮如是说。 纵观旗下数智人的整体产品矩阵,其形象类型非常丰富,覆盖3D写实、3D半写实、3D卡通、2D真人、2D卡通五种风格,能够掌握数百种肢体动作和细腻的面部表情,支持内容生产、形象资产管理等方面的服务。 2D真人风格分为精品和小样本两种模式。前者主要面向客服、虚拟IP形象等场景,成本约在数十万、百万级别,需要一个专业主播在录影棚录制一到两天,才能完成形象的打造。 而本次沟通会上推出的数智人,是2D真人小样本数智人。其也是根据真人形象定制,普通人只需要录制3至5分钟的视频,就能够生成属于自己的数智分身,人工成本、时间和效益等已经迎来了极大的改善。 具体来说,用户只需提交少量的样本数据进行AI训练,比如3分钟真人口播视频、100句语音素材,就能在24小时内打造出一个真人形象、语音非常逼真的数智分身。 据此得到的数智人,既支持半身或全身形象展示,又能根据内容调整动作、手势、口型、表情等,还支持任意更换录制背景,应用场景的适用性得到极大的增强。 事实上,2D小样本技术是由3D技术来提供支撑的。腾讯优图实验室研究总监汪铖杰表示:“小样本数智人从直观上感受是2D视频,背后其实是3D人像在做支撑。从‘文本/音频’信息到‘3D人像驱动’再到‘2D人像视频’的模式,通过3D人脸结构的先验信息引入,使数智人口型、表情更到位,让小样本数智人形象实现‘皱纹级’还原。” 从声音复刻上看,小样本智人基于腾讯自研的新一代小样本音色制定技术,其特点是:既能够改善传统的语音模型的韵律单一,也能够提高声音合成精度,而且又能够改善语音合成中存在的语音重复频率、语调偏少等问题。 首先,在基础设施服务层面,基于腾讯云强大的算力体系,提供强有力的支撑。其次,依托腾讯云TI平台这个一站式低门槛、低代码的训练平台。基于TI-平台即服务的能力,构建标准化、工业化的数智人生产工厂。该工厂覆盖数智人生产的全流程环节,集成了十余种AI算法。未来,即使是无研发经验的普通用户也可以自己操作并迅速创造出自己的[,相较于现实的虚拟分身。 不仅如此,腾讯云智能还面向行业开放“产、销、服”的一体化平台,将数智人工厂的生产能力开放给整个行业,赋能到每一个个体。使用者可以在腾讯云上开设账号、上传素材、下载订单,生产属于自己的数智分身。在进行效果确认之后,还能在交互服务平台、播报服务平台上使用,通过数智分身进行实时的视频生产和交互服务等。 在此之前,同样的工作需要由包括稿件制作人、主讲人、拍摄人等在内的全套制作团队,用一个月的时间来完成。如今,不需要摄影棚、拍摄和背稿,只需通过数智人平台,输入语音或文本音频,即可快速批量生成由专属数智人出镜的系列课程视频,充分实现对视频内容产出的降本增效。 微媒数字会议创始人兼CEO天狐表示:“我们一直在和腾讯团队合作探索,如何帮助 IP老师更快地做出变化的样态视频,帮助媒体学子们快速产出有趣的内容,避免同质化的内容再大范围地在网络上传播。” 推动数智人应用快速落地,让其能以普惠化的发展形式走入千行百业,是腾讯云智能打造数智人业务的初心。未来,其还将在自然语言处理、自动语音识别等人工智能技术上发展壮大,探索应用场景的丰富性,和生态伙伴的相互融合等方向上持续发展,为数智人发展打开了更加广阔的局面。 (编辑:汽车网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐