筑波大学生命科学中心生存研究中心牧野正治教授和国立信息学研究所信息学原理研究所小野纯纪副教授的研究小组是从多个设备记录的多人重叠声音中的一个人. 我们开发了一种语音信号处理技术,可以将一个语音分开,并可以同时识别多个语音。预计用于自动创建会议记录。
据筑波大学介绍,该研究小组开发了一种新的信号处理技术,可以在录制后同步在不同设备上录制的多个未同步的录制信号。将其与国立信息学研究所小野实验室开发的高速盲分离技术相结合,将多个说话者的声音混合成单个语音的对话进行分离后,应用和识别语音识别,取得了巨大的成功。提高性能。
通过应用这项技术,如果会议参与者在他们的个人智能手机上记录会议内容,则可以自动创建会议记录。
语音识别功能近年来有了很大的提升,但是当用于多人说话重叠的对话和会议时,问题是功能会变差。
美国国家信息学研究所也在研究如何在网络系统中实施这项技术。该研究成果于9月8日在美国加利福尼亚州旧金山举行的演讲领域国际会议上发表。