由京都大学中村英太助理教授领导的研究小组开发了一种技术,可以根据钢琴演奏音频数据自动生成乐谱,并在世界上首次成功地生成了接近实际使用水平的乐谱。
“转录”,就是听音乐表演并把它们转录成乐谱,也称为耳拷贝,是一种只有经过特殊训练的人才具备的能力。正在研究在计算机上再现这种能力并可供任何人使用的“自动转录技术”。尤其是在转录钢琴演奏时,很难识别音高和节奏的复杂组合。
对于钢琴转录,“多音高检测”,即估计语音信号中每个时间发出的音高,以及以节拍时间为单位识别每个音符的发音时间和音符长度,存在“节奏量化”的问题。使用机器学习的方法的研究正在逐个进行,但这次研究小组构建了一个集成两种方法的自动钢琴转录系统。
在多音高检测中,使用深度神经网络来估计每次包含的声音的音高和强度,以及输入语音数据是否有击键。节奏量化所使用的模型基于人类演奏中包含的时间波动模型和表示乐谱中出现的一般节奏模式的统计特征的模型。此外,对于拍号和小节线位置的识别,我们通过使用捕获音符之间关系的统计数据提高了转录准确性。结果,我们成功地自动生成了可部分用于演奏和辅助人工转录的乐谱。
未来,它有望导致实际应用的研究和开发、音乐学研究和音乐教育的应用以及对支持文化的智能的科学理解。他还表示,迫切需要讨论与版权法相关的问题及其对音乐家的影响。