在雷凯老师与沈颖老师的指导下,16级学生袁凯琦的一篇论文被第18届IEEE International Conference on Bioinformatics and Biomedicine (BIBM2018) 录用。
下面是论文简介。
论文题目:Drug2Vec: Knowledge-aware Feature-driven Method for Drug Representation Learning
论文简介:正确的药物表示在医疗保健分析中具有广泛的应用,例如药物相互作用(DDI)预测和药物 – 药物相似性(DDS)计算。然而,药物应用涉及准确的药物特征选择和丰富的标注数据,需要耗费专家巨大的时间和精力。目前,关于药物向量特征表示的研究中仍存在特征稀疏,向量维数过高等瓶颈。为了减轻这些不足,我们提出了Drug2Vec,这是一种知识感知的特征驱动的方法,可以准确地学习药物相关知识。具体地,我们首先从药物领域特定语料库中学习药理学特征以改善药物区分度。然后,我们利用神经网络从各种知识库和语料库中学习药物分类特征和药物文本描述特征,解决单一数据源中药物属性的不完整性,并减轻不完整或不准确的公共和专有来源的限制。最后,提出了一种联合交互式学习方法,以根据各种药物特征的相关性发现和学习更多信息。我们对临床医学的医学数据集进行了一系列实验,以证明Drug2Vec能够表示药物特征。 从实验结果来看,Drug2Vec可以准确判别新的药物 – 药物相互作用关系,准确率高达92.19%,证明Drug2Vec显著提高了训练中未见的药物 – 药物相互作用关系的预测质量。
2018年12月3日到6日,袁凯琦同学前往西班牙首都马德里参加BIBM会议。BIBM会议是生物信息学及生物计算领域的顶级会议之一,旨在为计算机科学,生物学,化学,医药学,统计数学的科学家及学者提供了一个跨领域跨平台互相交流的平台, 被中国计算机学会(CCF)列为B类会议 。
本次会议共设24个workshop,46个session(涵盖105篇文章的presentation)和3个keynote组成。袁凯琦同学在主题为Cheminformatics, drug representation and interaction的会议厅进行了文章“Drug2Vec: Knowledge-aware Feature-driven Method for Drug Representation Learning”的学术报告。在Q&A环节,与会者提了很多问题,主要在数据来源,特征处理和医学数据在深度学习模型中的训练等方面,并对文章的工作予以肯定。在与各位学者讨论过程中,充分体会到了医疗与人工智能结合的挑战(医学背景知识,医学数据采集,医学特征的选择)。
通过这次会议,我听取了来自世界各地的学者的报告,同时也意识到了自己的不足,自己各方面的能力亟需提高。如今人工智能已经延伸至各个领域,如何进一步利用医学数据,从海量医学信息迅速有效的挖掘,找到“医疗+人工智能”的切实可行的落地场景是当今时代向我们提出的挑战。最后,再次感谢互联网研发中心雷凯老师和沈颖老师在论文写作、投稿等方面给予的支持。