近日,由北京大学互联网信息工程研发中心(CIRE)开发的中文医学知识图谱英文抗生素药物医学知识图谱IASO1.0发布,面向公众正式开放试用。IASO是利用自然语言处理与文本挖掘技术,基于大规模医学文本数据,以人机结合的方式研发的英文药物医学知识图谱。
IASO知识图谱基于DO,IDO,NCBI,HPO和DrugBank等数据库,以及在线百科,权威医学文献等高质量医学数据资源构建而成的。 涵盖507种传染病及其治疗方法,332个不同的感染部位,936种系统相关症状,371种并发症,838,407种细菌,341种抗生素及其介绍,1,504对抗生素和细菌之间的反应速率(抗菌谱),431对药物相互作用关系,以及86对抗生素特异性群体的禁忌关系。
基于药物医学知识图谱IASO,课题组还进行了药物开发中的关键一环——药物相似性计算的相关探索,包括研究抗生素与其副作用之间的关系和探讨NDF-RT药物基本药理学特性的作用机制等。为验证基于IASO的药物相似性计算的准确性,我们邀请至少3名医生对1326对最常用的抗生素进行了标注,其范围为[0,1]。每位医生所给评分与平均评分之间的Pearson系数范围为0.827至0.864, Spearman系数范围为0.792至0.888,均证明了医生评估的可靠性。
课题组未来还将不断添加更多的医学实体及其层次化类别信息,继续迭代更新完善知识图谱,欢迎大家多提宝贵意见!在未来的工作中,我们将致力于建立大规模、高质量的中文/英文医学知识图谱,为智能医学奠定专业知识基础。
附1:IASO 1.0链接: http://www.iasokg.com/
附2:IASO药物知识图谱和药物相似性数据标注下载:http://www.iasokg.com/dataDownload#dataSet
欢迎大家试用并提出宝贵意见!IASO仅供学术研究使用,不做商业用途。
研发者团队
北京大学互联网信息工程研发中心(CIRE):雷凯副教授、沈颖助理研究员、研究生袁凯琦、温德斯、戴竞超。
雷凯副教授:
1998年毕业于北京大学计算机系,获学士学位;1999年毕业于美国哥伦比亚大学计算机系,获硕士学位;2015年毕业于北京大学计算机系统结构专业,获博士学位。现为北京大学深圳研究生院信息工程学院副研究员,硕士生导师,北京大学信息工程学院院长助理,深圳市云计算关键技术与应用(SPCCTA)常务副主任,北京大学互联网信息工程中心常务副主任,北京大学深圳研究生院工会副主席(2014年9月至今)、计算机学会CCF YOCSEF(深圳)主席(2017-2018)、深圳市高层次人才。主持过国家自然科学基金1项、国家发改委项目1项,省部产学研项目3项。参与973、863计划、科技支撑计划、国家自然科学基金等项目10多项。独立及主要协助培养计算理学硕士毕业生68人(10届, 2006-2016),发表论文80余篇,专利申请13项(授权4项),软件著作权15项。编著教材一部《信息中心网络与命名数据网络》,北京大学出版社(2015年8月出版),获得深圳第三节教学科研成果著作奖。
沈颖助理研究员
沈颖,女,现任北京大学(深圳研究生院)助理研究员,博士(后)。深圳市海外高层次人才(孔雀C),深圳南山区领航人才。2011年7月获欧盟Erasmus Muduns自然语言处理(英国/法国)双硕士学位。2015年7月获法国巴黎第十大学生物/医学信息学博士。2015年7月开始于法国诺曼底大学-北京大学从事联合博士后科研工作。2015年访德国期间任德国科隆大学医学院访问学者。2017年9月出站后,于北京大学深圳研究生院任助理研究员。拥有智能医学领域内跨学科的计算机知识和医学知识,主要研究方向包括医学信息学,自然语言处理,数据挖掘,机器学习,人工智能等。近年来,在SCI期刊和会议AAAI, SIGIR, COLING, WWW, CIKM, ICDM, BIBM发表学术论文40余篇;受理发明专利6项;参与完成多项欧盟科教项目和省市科技项目。目前承担国家自然科学基金青年项目一项、深圳市基础研究自由探索项目一项、企业合作项目一项;参与并主要完成深圳市基础研究学科布局项目一项。关注科研成果的转化,医疗市场和病人的需求。