由大阪大学科学与产业研究所的Ryu Takeda助理教授领导的研究小组在“会话中包含的未知单词识别”技术中,根据已知单词的发音构成模式开发了一种“声音表达单元”语音对话系统所必需的。引入了一种使用的机制。

 近年来,已经发布了许多通过语音响应的机器人和应用程序,但基本上是一种仅识别预先注册的单词的机制。如果话语中包含其他单词(未知单词),它们将被替换为已知单词,无法正确识别为“单词”。如果您能正确识别“生词”部分,您就可以请人了解其含义。

 在研究中,我们着眼于自然语言处理技术中的“无监督分词”方法,并将其应用于话语中未知词的识别。这种方法通常针对书面文字,切割的单位是“字”,但应用于语音时,“声音表达单位”应该用什么,什么是有效的就不清楚了。作为单位,有音素(音标)和音节(平假名)等表达。

 在开发的方法中,使用“词形”计算的“基于发音的单位及其构成模式”被用作“声音表达单位”。该模式是根据出现在多个单词中的共同发音和出现位置来计算的,并且更容易识别具有接近已知单词的发音构成的未知单词。假设音素识别成功,则对日/英会话语料中的每个单元验证未知词的具体率。

 据说这个结果是实现语音对话系统所必需的技术,该系统不仅可以让开发人员提前准备和更新,而且可以在与人类交谈时学习并变得更聪明。

纸张信息:[2018 IEEE Spoken Language Technology Workshop (SLT)] 基于Pitman-Yor Semi-Markov Model Exploiting Subword Information的Phoneme Sequences Word Segmentation

大阪大学

每个人的“真正价值”成为大阪大学的“进化”。一所生活在社区并延伸到世界的大学

大阪大学是一所研究型大学,拥有11个学院和23个系。 自1931年创校以来,以“居于地域,通达世界”为座右铭,打造了以先进的教育和研究能力、教职工的和谐、传统的重量和大阪的优势。我有。利用这些优秀的潜力 […]

大学学报在线编辑部

这是大学学报的在线编辑部。
文章由对大学和教育具有高水平知识和兴趣的编辑人员撰写。