音乐人工智能与音乐信息科技系

Music Artificial Intelligence and Music Information Technology

音乐人工智能与音乐信息科技系

学术前沿|音乐人工智能系系列讲座——“音乐背景下的智能语音转换及语音分离技术”

信息来源:beat365官方网站 发布日期:2022-05-29 13:57:00 更新日期:2023-11-22 17:05:26


主讲嘉宾:郑文皇教授

主持人:李小兵教授
时间:2022年5月30日 10:00-11:30
题目:音乐背景下的智能语音转换及语音分离技术 

  

主办:音乐人工智能与音乐信息科技系

  

入场方式
ZOOM会议号:978 438 6825
入会密码:8888

  

题目:音乐背景下的智能语音转换及语音分离技术

  

报告简介:伴随着深度学习技术的不断成熟,智能语音领域取得一系列成功的应用。本次报告将分享我们研究组在智能语音分离和基于人脸的语音转换最新研究成果。语音分离这个问题来自于“鸡尾酒会问题”,是源分离问题的一种特殊场景,其重点仅在于重叠的语音信号源,而需要忽略其他干扰如音乐或噪声信号。语音转换旨在不改变语言信息的情况下将源说话者的语音转换为目标说话者的语音,具备广泛的应用场景,如口音转换,娱乐、残障人士支持和个性化语音助手等。由于人脸和声音之间存在密切关系,我们引入了一种从不同的人脸照片中生成不同声音风格的新想法,并提出了一种新颖的多对多语音转换网络,即 Face-based Voice Conversion (FaceVC),并且不需要额外的平行训练数据即可达到优异的结果。

 

嘉宾简介:郑文皇,台湾阳明交通大学电子研究所特聘教授,智能系统研究所所长,全家便利商店首席人工智能科学家;主要从事多媒体信息处理、计算机视觉、人工智能相关研究;IEEE杰出讲者;英国工程技术学会(IET) Fellow、ACM杰出会员、中国计算机学会杰出会员、兼任IEEE TMM与IEEE MM等期刊编委、IEEE多媒体系统与应用技术专委会(MSA-TC)主席、国际模式识别学会理事会成员(IAPR Governing Board Member);获2021 IEEE ICME最佳论文奖、TMM杰出编委(2020与2021连续两年)、指导学生获得2021 ICCV人脸活体检测挑战赛季军、2020 CVPR LIP Challenge冠军(多姿态虚拟服装试穿任务)、2020 ECCV GigaVision Challenge季军(行人和车辆检测任务)等国际学术荣誉。