关西医科大学和节南大学的研究团队正在考虑在药物发现研究中使用 AI(人工智能)。为了有效地找到活性化合物,明确了不仅显示生物活性的化合物而且不显示生物活性的化合物对于学习 AI 都很重要。
药物发现成功概率低,需要提高生产力。近年来,人们尝试利用人工智能来提高复合搜索的效率。已经提出了许多方法论,例如深度学习,但很少有研究关注人工智能学习数据。此外,据说在一般药物发现方法中使用的“高通量筛选(HTS)*”中,命中率保持在0.1%以下。迄今为止的药物发现中,我们只关注了少数Hit化合物,能够得到的许多“失败数据”组并没有被充分利用,只是被简单地丢弃了。
研究团队重点研究了这一药物发现领域的数据特征,即大部分化合物无活性的特征。 在 AI 学习中,如果将不表现活性的复合数据(反例)与表现活性的复合数据(正例)的比例增加 1,000 倍,AI 的误分类将小于 100/1,区分能力会降低。有了显着的提高。
通过利用这些知识,可以用较少数量的验证和药物资源进行筛选,并有望获得广泛的应用,从而显着降低药物发现研究的成本。该研究论文于3月18日星期四发表在学术期刊《分子信息学》(影响因子:2.741)上。
* 高通量筛选是一种从大量化合物中高效识别有用化合物的技术。