由京都大学中村英太助理教授领导的研究小组开发了一种技术,可以根据钢琴演奏音频数据自动生成乐谱,并在世界上首次成功地生成了接近实际使用水平的乐谱。

 “转录”,就是听音乐表演并把它们转录成乐谱,也称为耳拷贝,是一种只有经过特殊训练的人才具备的能力。正在研究在计算机上再现这种能力并可供任何人使用的“自动转录技术”。尤其是在转录钢琴演奏时,很难识别音高和节奏的复杂组合。

 对于钢琴转录,“多音高检测”,即估计语音信号中每个时间发出的音高,以及以节拍时间为单位识别每个音符的发音时间和音符长度,存在“节奏量化”的问题。使用机器学习的方法的研究正在逐个进行,但这次研究小组构建了一个集成两种方法的自动钢琴转录系统。

 在多音高检测中,使用深度神经网络来估计每次包含的声音的音高和强度,以及输入语音数据是否有击键。节奏量化所使用的模型基于人类演奏中包含的时间波动模型和表示乐谱中出现的一般节奏模式的统计特征的模型。此外,对于拍号和小节线位置的识别,我们通过使用捕获音符之间关系的统计数据提高了转录准确性。结果,我们成功地自动生成了可部分用于演奏和辅助人工转录的乐谱。

 未来,它有望导致实际应用的研究和开发、音乐学研究和音乐教育的应用以及对支持文化的智能的科学理解。他还表示,迫切需要讨论与版权法相关的问题及其对音乐家的影响。

纸张信息:[信息科学] 非本地音乐统计作为音频到乐谱钢琴转录的指南

京都大学

以“自重自重”的精神,培养自由的学术风格,开辟创造性学习的天地。

以自学为座右铭,我们将继续保持不受常识束缚的自由学术风格,培养兼具创造力和实践能力的人才。我们提供一个包容的学习空间,允许多样化和分层的选择,以便学生自己可以通过宝贵的反复试验选择一个坚实的未来。 […]

大学学报在线编辑部

这是大学学报的在线编辑部。
文章由对大学和教育具有高水平知识和兴趣的编辑人员撰写。