信息与通信研究组织(NICT)、埼玉大学和庆应义塾大学的研究小组在世界上首次成功地利用半导体激光器产生的光学混沌应用超高速光子学进行强化学习。
被称为“深度学习”和“强化学习”的技术对于支持现代人工智能 (AI) 的机器学习非常重要。强化学习是一种在未知环境中通过反复试验来学习的方法。中心问题是“如何在拥有许多老虎机的赌场中最大化利润”(=“多臂老虎机问题”)的问题。
要想利润最大化,就必须尝试击球台,但如果尝试太多,就会赔钱,如果早点停止,就会错过击球台。这种“搜索”或“决策”问题的解决方案是随机选择一个平台,该平台过去使用基于计算机计算程序生成的“伪随机数”,但需要时间和随机数“有也是对“质量”的限制。因此,课题组提出了“直接利用自然界中的物理现象进行强化学习”,并成功实现了使用单光子的方法。
在这项研究中,我们利用使用半导体激光器时发生的光的“混沌现象”(注),实现了从两台老虎机中选择命中率高的机器的超快速解决方案。对半导体激光器产生的激光混沌光进行高速采样,仅根据“过去的战斗历史”确定“阈值”的大小来做出决策。因此,信息从输入到输出的时间为十亿分之一秒(2纳秒),属于高速决策,性能优于使用伪随机数的常规方法。未来,它有望作为人工智能和物联网的基础技术做出巨大贡献,例如瞬时频率分配。
(注)半导体激光器发出的光被反射镜反射返回激光器时,激光器的工作变得不稳定和混乱的现象(初始状态的微小差异在时间)发生。