生成式AI改变生活与社会～了解特点与注意事项，好好相处～

包括Chat GPT在内的生成式AI正在逐渐渗透到我们的生活中。虽然非常方便，但信息输出并不总是正确的。如何用好一代AI并建立关系……？我们采访了宫森博士，他说：“你需要了解它的特点和预防措施。”

什么是生成式人工智能？

　生成式人工智能是能够“创造”文字、图像等的人工智能。传统人工智能是一种理解型人工智能，专注于“理解”文字和图像等事物。 Generation AI已经存在了一段时间，但性能并不高，所以直到Chat GPT出现才受到太多关注。

　Chat GPT 是生成式 AI 的代表例子，它可以流畅地与人互动，回答人类问题、提出想法、帮助写作、响应各种请求。已经有用日语等自然语言进行问答和对话的系统，但ChatGPT的独特之处在于输出文本的质量非常高。它与以前的系统有很大不同，它不仅对文本进行总结，而且还以要点和表格的形式进行总结。

　另一方面，生成图像的人工智能的使用也在扩大。例如，构建一个从X射线图像诊断疾病的AI需要大量高质量的X射线图像，但在罕见疾病的情况下，很难收集这样的X射线图像。因此，据报道，通过添加图像生成AI创建的伪X射线图像进行训练，可以提高疾病诊断性能。类似的用途是利用卫星图像来检测非法渔船。生成式人工智能对我们的生活和社会的影响是巨大的，目前世界各地的立法正在快速进展。

生成式人工智能存在哪些问题？

　尽管生成式人工智能看起来很方便，但也存在问题。一是输出内容的准确性无法保证。例如，您是否曾向 Chat GPT 询问餐厅推荐并收到虚构的商店名称和地址？请小心，因为答案很自然。处理医疗或法律事务时要特别小心。另一个问题是“人类常识”不适用。例如，
Chat GPT 毫无问题地表明它无视法律。如果你向他们询问如何增加居酒屋酒吧的销售额，他们可能会提供诸如向未成年人提供酒精饮料等建议。

　造成这些问题的原因之一是生成式人工智能学习句子的机制与人类不同。例如，处理单词的生成式AI（大规模语言模型；也称为LLM），例如Chat GPT，它根据从互联网收集的大量句子来学习哪个单词最有可能出现在某个单词旁边。去做。换句话说，像Chat GPT这样的生成式AI只能纯粹基于单词的规律性来获取知识（注）。

　另一方面，人类通过身体和五种感官接受外界的许多刺激来获取语言知识。这种类型的学习对于 Chat GPT 和其他没有物理身体的设备来说是不可能的，因此目前人类的感官和知识之间存在很大的差距。
注意：关于聊天 GPT，2023 年 9 月发布了名为 GPT-4V 的新版本，现在它不仅可以处理文字，还可以处理图像。

给高中生的话

　为了正确理解Chat GPT等生成式AI的机制，仅仅学习编程是不够的，数学知识也必不可少。你不必特别擅长数学，但你应该学习它，这样你就不会觉得自己不擅长数学。另外，人工智能技术发展很快，很多最新成果都是用英文公布的，所以我们建议您不断提高英语水平。

　你可能在选择职业道路时遇到一些困难，但我希望你密切关注社会动态，找到一个让你兴奋、你认为有趣的领域。生成式人工智能是一项新技术，正在给社会各个领域带来变革。如果你对技术开发感兴趣，我希望你了解它是如何运作的并充分发挥你的能力。此外，即使你对技术发展不感兴趣，加深对人工智能的基本理解也很重要，因为人工智能本身的进化预计将继续对我们的生活和社会产生重大影响。在预测未来的同时，找到一个可以完成你想做的事情的环境，并主动投入其中。

什么级别？

　在专业学科课程中，我们仔细解释自然语言处理和机器学习，包括最新技术。我们主要采用翻转课堂的形式，学生通过观看点播讲座视频进行准备，并在课堂上进行小组作业。我们试图鼓励学生积极、互动地参与，通过创建自己的问题来检查他们所学的知识并填补示例程序中的空白，从而实现深度学习。

　实验室每周举办一次研讨会，负责人汇报自己的研究进展，大家讨论内容。我们有几个小时的讨论，所以我认为每周都是一段紧张而充实的时间，在这里我获得了我自己无法获得的见解和新信息。

　我们实验室有很多学生在自然语言处理、计算机视觉、机器学习、信息检索等领域进行跨学科研究，而且我们很多毕业生，无论是本科生还是研究生，都利用自己的研究成果找到了工作。。

什么样的研究？

　我目前的研究主题之一是处理文字和图像的人工智能如何理解数字等抽象概念，以及如何提高这种理解。

　目前的人工智能系统，例如大规模语言模型（LLM），据说在理解和计算数字方面很弱。例如，涉及 4 位 x 4 位的计算几乎永远不会正确。如果你将它链接到计算器之类的计算应用程序上，你就可以得到正确的答案，但单独做起来很难。

　在我们的实验室里，我们正在研究人工智能如果能像人类一样理解数字10，是否也能准确理解数字1000并根据情况使用它。例如，您可以显示一个图像（上图），其中各种颜色、形状和材料的物体排成一圈，然后问“从黄色金属圆柱体开始逆时针方向数的第三个物体是什么” ？’’让AI回答你想使用哪些物体。如果是第三个，AI就会正确回答。然而，当数字变大时，例如第3个和第10个，就无法正确回答。目前人工智能对数字的理解还比较肤浅，还没有达到即使是位数多的数字也能准确使用的深刻理解。我们的目标之一是找到提高这种理解水平的方法。

京都产业大学信息科学与工学部教授

宫森恒先生

1997年早稻田大学大学院理工学研究科博士课程结业。博士（工程学）。专注于多媒体数据工程、机器学习和信息检索。我原本对电气工程感兴趣，但在大学里我主修的是电子与通信系，涉及广播和通信。第四年，他加入了一个处理视频的实验室，并参与了与目前用于数字地面广播的MPEG标准相关的研究。获得学位后，他在NICT（现为国立信息通信技术研究所）工作，研究视频场景检索、电视节目与互联网的综合利用以及信息可靠性评估支持。 4年成为京都产业大学计算机科学与工学部副教授，2008年晋升为教授，现留任。大阪府立北野高中毕业。

京都产业大学: 汇集了10个学部和18个文科系的综合性大学
京都产业大学是一所综合性大学，拥有 10 个学院和 18 个文科学部，一个校区内约有 15,000 名学生在读。利用这一优势，我们培养可在现实世界中使用的先进专业知识和技能，并通过教师以外的知识交流开展全面而灵活的学习。每个领域的第一名 […]
→ 京都产业大学详情