情感语音转换技术研究取得新进展
发布时间:2022-09-09
来源: 河北省科学技术厅
作者:佚名
科技日报呼和浩特8月23日电(记者张景阳通讯员胡红波)记者23日从内蒙古大学计算机学院获悉,该院刘瑞研究员所在科研团队与日本大阪大学科学与工业研究所科研团队合作,在国际信号处理领域TOP期刊《IEEE/ACM音频、语音和语言处理会刊》发表了“通过源滤波网络将独立于说话人的情感解耦以进行语音转换”的最新研究成果。
据介绍,情感语音转换(VC)旨在将中性语音转换为情感声音,同时保留语言信息和说话者的身份。科研团队注意到,将情感特征与其他语音信息(例如内容、说话者身份等)解耦是实现高质量转换效果的关键。由于情感语音中声学特征的解耦更加复杂,面向中性语音的特征解耦一直无法得到很好的处理。
科研团队针对情感语音转换的声学特征解耦问题开展研究,提出了一种基于“源—滤波器”模型的情感语音转换系统,具体来说,是为了解决情感语音转换的特征解耦问题而提出一种新颖的基于“源—滤波器”模型的情感VC模型(简称SFEVC),以从音色和音调特征中准确过滤说话人独立的情感线索。SFEVC模型由多通道编码器、情感独立编码器、预训练的说话人相关编码器和相应的解码器组成。所有编码器模块都采用信息瓶颈自动编码器。
为了进一步提高各种情绪的转化质量,研究团队还提出了基于二维VA(激活度—效价)空间的训练策略。实验结果表明,SFEVC模型以及VA训练策略的表现均优于所有基线系统,并基于非平行数据在说话人无关的情感VC场景下实现了最优性能。
原文链接:https://kjt.hebei.gov.cn/www/kxpj22/kjqy89/268118/index.html
[免责声明] 本文来源于网络转载,仅供学习交流使用,不构成商业目的。版权归原作者所有,如涉及作品内容、版权和其它问题,请在30日内与本网联系,我们将在第一时间处理。
最新加入
2024-12-25生态环境部公布第三批...
2024-12-24关于公示2024年第...
2024-12-24巴彦淖尔市科技系统扎...
2024-12-24克拉玛依市科技创新大...
2024-12-24青科力量的田野情怀
2024-12-24青创前沿 | 包金小...
2024-12-24自治区科技厅举行宪法...
2024-12-24科技“突围”工程储能...
2024-12-24国产桌面操作系统发布...
热门资讯
2021-01-28落实综合监管要求,盯...
2021-01-28河南能源监管办迅速传...
2021-01-28河南能源监管办强化供...
2021-01-28河南能源监管办开展党...
2021-03-19驻信阳市生态环境局纪...
2021-03-19中共河南省生态环境厅...
2019-03-12北大在常温常压水相电...
2021-03-19省生态环境厅王喜云副...
2021-03-19省生态环境厅召开20...
2021-03-19生态环境厅召开巡视整...