筑波大学的一个研究小组收集了以日语为母语的人阅读英语句子时总计超过 41 万个单词的眼动数据集,并将其创建并发布为筑波眼动追踪语料库(TECO)。
很明显,阅读理解过程中的眼动数据对于阐明人类处理和理解书面文字的过程很有用。因此,近年来,人们努力系统地整理和发布使用眼动追踪方法收集的用于母语和外语阅读理解的大规模眼动数据,作为眼动追踪语料库。然而,大部分英语学习者的数据是在欧洲及周边地区收集的,缺乏亚洲的数据。
因此,该研究小组与 41 名母语为日语的英语学习者合作,收集了约 2 个单词(总计超过 1 个单词)的眼动数据。
该数据集包括句子中每个单词的注视总数、注视总持续时间、第一次注视持续时间、直到阅读下一个单词的注视持续时间以及重读共九个指标。 :阅读下一个单词之前的注视持续时间,是否跳过该单词,是否从下一个单词开始重读,是否有第二次注视,是否有第二次阅读。分析结果表明,所收集的眼动数据保持了可靠性和有效性。
收集到的数据发布在筑波眼动追踪语料库(TECO)的开放科学平台上,预计将用于文本理解和语言习得的研究。人们还认为,这将对广泛的学术领域产生连锁反应,包括自然语言处理和人工智能研究。