京都大学信息学研究生院黑桥贞夫教授和日本科学技术振兴机构情报企划部研究员中泽俊明开发了日本-中国和中国-日本科技论文的机器翻译系统,使用一个神经网络*。 从2018年5月8日起,该系统在日本科学技术振兴机构的网站上提供。

 近年来,中国发表的科技论文数量已成为仅次于美国的全球第二大科技论文,对用中文写成的日文科技文献进行搜索和浏览的需求越来越大。处理速度快、成本低的机器翻译有望普及,但科技信息翻译中存在代表最新技术的各种技术术语和新词,因此希望提高机器翻译的准确率。翻译……

 在此背景下,从2013年开始,京都大学信息学研究生院、科学技术振兴机构信息企划部、中国科学技术信息研究所合作,为科技论文打造高精度神经机器。关于“日中/中日机器翻译实践应用项目”,推动翻译系统的实际应用。

 在项目中,我们准备了超过400万个基于科技论文的中日双语语料库(=用于机器翻译训练的教师数据)。这些都是通过这次开发的神经机器翻译引擎学习的,通过准备双语词典减少了误译和遗漏。结果,开发中设定的97%的评价标准“包含最重要的信息”和“易于理解,没有过多或不足的信息”,翻译准确率达到了6%左右。此外,在2016年12月举办的亚洲语言国际机器翻译研讨会“WAT2016”的评测中,在科技信息机器翻译任务中表现出最高准确率。

 预计日中/中日机器翻译系统将通过双语语料库和双语词典的开发,即使是尖端技术信息也能提供高度准确的翻译。

* 神经网络是设计用来模仿人类脑细胞信息传递机制的计算模型。计算机用于“深度学习”以理解复杂的事物,近年来,它们不仅用于机器翻译,还用于高级图像识别、围棋和将棋等众多领域。

京都大学

以“自重自重”的精神,培养自由的学术风格,开辟创造性学习的天地。

以自学为座右铭,我们将继续保持不受常识束缚的自由学术风格,培养兼具创造力和实践能力的人才。我们提供一个包容的学习空间,允许多样化和分层的选择,以便学生自己可以通过宝贵的反复试验选择一个坚实的未来。 […]

大学学报在线编辑部

这是大学学报的在线编辑部。
文章由对大学和教育具有高水平知识和兴趣的编辑人员撰写。