沈颖老师与16级袁凯琦参加ICDM2018国际学术会议

在雷凯老师和沈颖老师的指导下,16级学生袁凯琦的一篇Demo论文被第18届IEEE International Conference on Data Mining(ICDM 2018)录用。下面是论文简介. 论文题目:IDDAT:An Ontology-Driven Decision Support System for Infectious Disease Diagnosis and Therapy 论文简介:基于传染病和抗生素本体,参考临床上疾病诊断与病历数据,文章提出一套为常见感染疾病及其诊疗自动医疗决策系统IDDAT。IDDAT所使用的本体还与医疗领域其他本体进行对比实验,在疾病诊断和治疗方案方面的准确性,召回率等指标均获得十分出色的表现。 2018年11月17日至20日,沈颖老师和研三学生袁凯琦前往新加坡圣淘沙岛会议中心参加ICDM会议。圣淘沙岛位于新加坡本岛南部,素有“欢乐宝石”的美誉。ICDM涵盖了数据挖掘的所有方面,吸引了来自统计、机器学习、模式识别、数据库、数据仓库、数据可视化、基于知识系统和高性能计算等领域的研究人员,应用程序开发人员与从业人员。ICDM旨在促进新颖、高质量的研究成果和对具有挑战性的数据挖掘问题的解决方案, 被中国计算机学会(CCF)列为B类会议 。 本次会议共设立Deep Learning,Recommendation,Bioinformatics等分会场。现场各位学者做了精彩纷呈的学术回报,在听取报告时,遇到了不少与实验室知识图谱组联系比较紧密的课题,我们也提出了不少问题,随着讨论的深入,也加深了对文章的理解。会后,学生袁凯琦在沈老师的指导下,将继续紧密follow一些相关研究:Dynamic Illness Severity Prediction via Multi-task RNNs for Intensive Care Unit,A United Approach to Learning Sparse Attributed Network Embedding等文章,以进一步开展毕业设计研究工作。 18日1:30至5:40是Demo Paper展示环节。我们给与会者讲解了“IDDAT: An Ontology-Driven Decision Support System for Infectious Disease Diagnosis and Therapy”。在讲解过程中,大家比较关心数据来源,疾病诊断与决策的底层实现,知识图谱的存储与推理等等问题,充满体会到了医疗与人工智能结合的挑战(医学背景知识,医学数据采集),并对我们的工作予以肯定。 听完三天的会议报告,我们获益匪浅,并且总结了目前主要的研究趋势: 多视角注意力机制 多任务学习 时间序列信息 User信息编码 我们希望在接下来的日子,能够把这些新想法融合到实验室的研究工作中。最后,感谢互联网研发中心雷凯老师和沈颖老师在论文写作、投稿等方面给予的支持。 ...
Read More

近年来内容中心网络与区块链重点实验室优秀文章概览(二)

实验室经过这几年的积累,发表了不少优秀的文章,现在在这做一个展示概要,包括文章的简介,pdf链接以及部分文章的开源代码github链接。 IEEE Transactions on Industrial Informatics ( Volume: 14 , Issue: 6 , June 2018 ) An NDN IoT Content Distribution Model With Network Coding Enhanced Forwarding Strategy for 5G 文章链接:https://ieeexplore.ieee.org/document/8170270 作者:Kai Lei,Shangru Zhong ,Fangxing Zhu,Kuai Xu,Haijun Zhang 简介:第五代(5G)物联网(IoT)应用的挑战性要求激发了对可行网络架构的期望需求,而命名数据网络(NDN)是支持高密度物联网应用的合适候选者。为了在大规模物联网应用中有效地分发越来越多的数据,本文将网络编码技术应用到NDN中,以提​​高物联网网络吞吐量和5G内容传输效率。基于概率的多径转发策略被设计用于网络编码以充分利用其潜力。为了量化在5G NDN中应用网络编码的性能优势,本文将网络编码集成到ndnSIM模拟器中实现的NDN流媒体系统中。实验结果清楚而公正地表明,考虑5G NDN中的网络编码可以显着提高性能,可靠性和QoS。此外,这是一般解决方案,因为它适用于大多数缓存方法。更重要的是,我们的方法在提供包括高质量流视频服务在内的不断增长的物联网应用方面具有巨大的潜力。 Abstract: The challenging requirements of fifth-generation (5G) Internet-of-Things (IoT) applications have motivated a desired need for feasible network architecture, while Named Data Networking (NDN) is a suitable candidate to support the high density IoT applications. To effectively distribute increasingly large volumes of data in large-scale IoT applications, this paper applies network coding techniques into NDN to improve IoT network throughput and efficiency of content delivery for 5G. A probability-based multipath forwarding strategy is designed for network coding to make full use of its potential. To quantify performance benefits of applying network coding in 5G NDN, this paper integrates network coding into a NDN streaming media system implemented in the ndnSIM simulator. The experimental results clearly and fairly demonstrate that considering network coding in...
Read More

15级张丽珠同学中稿JOURNAL OF BIOMEDICAL INFORMATICS期刊

Journal of Biomedical Informatics 期刊 Journal of Biomedical Informatics(https://www.journals.elsevier.com/knowledge-based-systems/) 是人工智能领域跨学科、面向应用的学术期刊,最新的影响因子(IF)为2.882。 15级同学张丽珠,在实验室雷凯老师和沈颖老师的指导下,完成一篇论文,并已确认被Journal of Biomedical Informatics 期刊录用,论文具体简介如下: 标题:CBN: Constructing a Clinical Bayesian Network based on Data from the Electronic Medical Record 作者:Ying Shen, Lizhu Zhang, Jin Zhang, Min Yang, Buzhou Tang, Yaliang Li, Kai Lei 链接:https://authors.elsevier.com/a/1Y1Yd5SMDQYjHP 简介: 从电子病历(EMR)学习涉及疾病和症状的候选因果关系的过程是学习直接从真实医疗保健数据执行诊断推断的模型的第一步。然而,现有的诊断推理系统依赖于诸如本体之类的知识库,其通过劳动密集型过程手动编译或者使用简单的成对统计自动导出。我们探索CBN,一种用于医学本体概率推理的临床贝叶斯网络构建,直接从EMR学习高质量贝叶斯拓扑和完整本体。具体来说,我们首先从超过10,000个被识别的患者记录中提取医疗实体关系,并采用优势比(OR值)计算和K2贪婪算法来自动构建贝叶斯拓扑。然后,贝叶斯估计用于概率分布。最后,我们采用贝叶斯网络来完成本体的因果关系和概率分布,以增强本体推理能力。通过评估学习的拓扑结构与医生的专家意见和熵计算以及通过计算基于本体的诊断分类,我们的研究表明,从医疗记录中直接和自动构建高质量的健康拓扑和本体是可行的。我们的结果是可复现的,我们将在文章发布后发布该工作的源代码和CN-Stroke知识图谱。...
Read More

16级邓扬中稿AAAI 2019

The Thirty-Third AAAI Conference on Artificial Intelligence (AAAI-19) 将于2019年1月27日至2月1日在美国夏威夷举行。AAAI是人工智能领域的顶级国际会议(https://aaai.org/Conferences/AAAI-19/),CCF A类会议。   16级邓扬同学在雷凯老师和沈颖老师的指导下,在本次会议中被录用了一篇论文,下面是论文简介: Multi-Task Learning with Multi-View Attention for Answer Selection and Knowledge Base Question Answering 作者:Yang Deng, Yuexiang Xie, Yaliang Li, Min Yang, Nan Du, Wei Fan, Kai Lei*, Ying Shen* (*Correspond Author)   简介:答案选择和知识库问答(KBQA)是问答系统的两个重要任务。现有的方法分别解决这两个任务,需要大量的重复工作,而忽略了任务之间丰富的相关信息。本文基于以下动机,通过多任务学习(MTL)同时处理答案选择和KBQA任务。首先,答案选择和KBQA都可以看作是一个排序问题,一个在文本级别,而另一个在知识级别。第二,这两个任务可以互相促进:答案选择可以结合来自知识库(KB)的外部知识,而KBQA可以通过从答案选择中学习上下文信息来改进。为了实现联合学习这两项任务的目的,我们提出了一种新的多任务学习方案,它利用从不同角度学习的多视角注意力,使这些任务能够相互交互,并学习更全面的句子表示。在多个真实数据集上的实验验证了该方法的有效性,提高了答案选择和KBQA的性能。此外,多视角注意力机制被证明能有效地从不同表征角度组装注意力信息。...
Read More

近年来内容中心网络与区块链重点实验室优秀文章概览(一)

实验室经过这几年的积累,发表了不少优秀的文章,现在在这做一个展示概要,包括文章的简介,pdf链接以及部分文章的开源代码github链接。 COLING 2018国际会议 Knowledge as A Bridge: Improving Cross-domain Answer Selection with External Knowledge 作者:Yang Deng, Ying Shen, Min Yang, Yaliang Li, Nan Du, Wei Fan, Kai Lei 文章链接:https://aclanthology.coli.uni-saarland.de/papers/C18-1279/c18-1279 简介:答案选择是一项重要而具有挑战性的任务。在大量标记的训练数据可用的领域已经取得了显著的进展。然而,获得丰富的注释数据是耗时和昂贵的过程,将答案选择模型应用到具有有限标记数据的新领域将会有很大的障碍。在本文中,我们提出了知识感知注意力网络(KAN),一个跨领域答案选择的迁移学习框架,使用知识库作为桥梁,使知识从源领域转移到目标领域。具体地,我们设计了一个知识模块,将基于知识的表示学习集成到答案选择模型中。所学的基于知识的向量表示由源领域和目标领域共享,这不仅利用大量的跨领域数据,而且还受益于正则化效应,从而导致更通用的文本表示来帮助新领域中的任务。为了验证我们的模型的有效性,我们使用SQUAD-T数据集作为源域数据集和三个其他数据集(即yahoo QA,TREC QA和insuranceQA)作为目标域。实验结果表明,KAN具有很强的适用性和通用性,在跨域答案选择方面明显优于目前最好的模型算法。 Abstract Answer selection is an important but challenging task. Significant progress has been made in domains where a large amount of labeled training data is available. However, obtaining rich annotated data is a time-consuming and expensive process, creating a substantial barrier for applying answer selection models to a new domain which has limited labeled data. In this paper, we propose Knowledge-aware Attentive Network (KAN), a transfer learning framework for crossdomain answer selection, which uses the knowledge base as a bridge to enable knowledge transfer from the source domain to the target domains. Specifically, we design a knowledge module to integrate the knowledge-based representational learning into answer selection models. The learned knowledge-based representations are shared by source and target domains, which not only leverages large amounts of cross-domain data, but also benefits from...
Read More

16级章奇超、17级谢英英、18级李渝中稿ICPADS 2018

第24届 International Conference on Parallel and Distributed Systems(ICPADS 2018) 将于2018年12月11日至13日在新加坡圣淘沙岛举行,此前的活动取得了成功。圣淘沙岛位于新加坡本岛南部,素有“欢乐宝石”的美誉。 ICPADS 2018旨在为全世界的科学家,工程师和教育工作者提供一个高水平的国际论坛,展示和分享关于并行和分布式系统的最新研究成果。ICPADS被CCF推荐为计算机体系结构/并行与分布计算/存储系统类C类会议,会议链接 https://icpads.sg。   16级学生章奇超延续15级徐丽妹的工作,在雷凯老师和齐竹云老师的指导下论文被ICPADS 2018录用。 论文题目:Reputation-based Byzantine Fault-Tolerance for Consortium Blockchain 论文作者:Kai Lei, Qichao Zhang, Limei Xu and Zhuyun Qi 论文简介: 实用拜占庭容错算法在联盟区块链系统中得到了广泛应用,但该类算法难以及时识别出错节点,易受针对于主节点的各类攻击,并且其共识成员的投票话语权的相同,不适用于话语权区分的场景。为了解决这些问题,本研究提出了基于信誉的拜占庭容错(RBFT)算法。我们设计了信誉模型来评估共识过程中每个成员的行为,出错节点将会被降低信誉分,并且在共识过程中获得较低的话语权。另外,我们设计了基于信誉分的主节点切换方案,高信誉分的节点将具有更多的机会成为主节点来产生合法区块。实验结果表明RBFT获得了良好的性能,并确保了系统的安全性和可靠性。   17级学生谢英英延续15级石涧的工作,在雷凯老师指导下的论文被ICPADS 2018长文录用。 论文题目:OptCaching: A Stackelberg Game and Belief Propagation Based Caching Scheme for Joint Utility Optimization in Fog Computing 论文作者:Kai Lei, Yingying Xie, Jian Shi, Haijun Zhang, Gong Zhang, Bo Bai 论文简介:雾计算将云计算的概念延伸到网络边缘,为大量有低延时要求的应用提供支持。本文研究在三层雾计算场景下,如何合理分配雾节点缓存资源使得联合优化内容提供商、网络运营商和用户的效用。本文对内容提供商、网络运营商和用户之间缓存租赁、定价、利用行为进行建模,并且定义了三者各自的效用函数;将内容提供商与网络运营商之间的缓存定价和租赁行为建模为一个Stackelberg博弈,通过理论分析找到了Stackelberg均衡点;设计了一个基于置信传播的分布式缓存放置算法,通过降低用户平均下载延迟进一步优化了用户效用。实验验证了在Stackelberg均衡点处三者效用达到联合优化的状态;相比于基于全局流行度的缓存放置策略,用户的平均下载延迟降低了33.7%。   18级学生李渝延续15级朴雪威的工作,在雷凯老师的指导下论文被IEEE   ICPADS  2018长文录用。 论文题目 :NDN Producer Mobility Management based on Echo State Network: a Lightweight Machine Learning 论文作者:Kai Lei, Yu Li, Xuewei Piao, Haijun Zhang 论文简介:命名数据网络(Named Data Networking , NDN)从架构设计上天然地支持了内容消费者移动,但是在内容生产者移动的问题上没有给出很好的解决方案,具有很大的研究空间。根据现有的研究,本文提出了一种基于回声状态网络(Echo State Network,ESN)预测的NDN生产者移动策略。在生产者移动切换发生之前,根据预测对网络设备进行预配置,以低带宽代价提升内容响应速度并降低因移动切换带来的额外时延,实现无缝切换。模型分析以及在ndnSIM上的仿真实验结果表明,本文策略在切换延时,丢包率,切换开销等指标上均具有一定的优势。  ...
Read More

17级杜茂瑜、谢英英同学参加2018中国区块链技术与应用高峰论坛

2018年9月15日,17级同学杜茂瑜、谢英英在雷凯老师的带领下,参加了中国区块链技术与应用高峰论坛暨中国计算机学会区块链专委会第一次工作会议。 本次峰会由由福州市人民政府和中国计算机学会主办。为期两天的论坛,国内区块链领域学者和行业精英,分别围绕区块链的体系结构、安全与隐私保护等技术,以及区块链标准规范、创新应用、产业落地等内容作主题演讲。 区块链作为近期备受关注的信息技术,在行业需求和实际落地应用上都还有许多亟待解决的问题。会上学者主要就区块链技术的发展现状和研究方向进行讨论,行业代表则重点关注区块链的应用落地。论坛了充满学术界和产业界智慧的碰撞和信息的交流。...
Read More

2018未来网络、区块链与数据智能科研交流汇报会

  2018年9月10日星期一上午,未来网络、区块链与数据智能科研交流汇报会在北京大学信息工程学院C125汇报厅圆满举行。本次交流会恰逢教师节和并且中秋节也将到来,因此实验室也给每位老师送上了节日的祝福和精美的礼物。出席本次交流会的有平安执委,首席科学家肖京博士、香港华为未来网络理论实验室高级研究员白铂博士、哈工大深圳计算机学院院长王轩、清华深圳网络PI, 科技处江勇处长、还有先进院的杨敏博士、清华大学深圳研究生院的郑海涛老师、哈工大深圳校区的汤步州老师、南科大金融系的陈坤老师以及实验室全体学生。 本次交流会首先由肖京博士和白铂博士给大家带来了精彩的报告。平安执委,首席科学家肖京博士从企业应用视角结合“智能”+大数据分析方法和平安集团的金融应用,分析了金融领域智能化所遇到的挑战和机遇,让大家有了对“智能”+金融的前景的具体感受和憧憬。 而作为香港华为未来网络理论实验室高级研究员的白铂博士首先对他们的实验室做了一个介绍,然后从专业角度向我们讲解了无线网络建模等无线网络理论,从图分解,机器学习和信息论的角度对无线网络问题进行了分析,并点名了机器学习对提高网络性能的重要性。另外哈工大深圳计算机学院院长王轩、清华深圳网络PI, 科技处江勇处长也发表了精彩的交流感言,并且对本次交流会的形式很满意,并且希望以后可以组织北大清华哈工大三校的 交流汇报,让活动举办得更加丰富多彩。 肖京博士和白铂博士的精彩报告之后,实验室网络体系组,区块链组,知识图谱组和Web与Data智能处理与分析组的同学首先以英文汇报的形式,对各自组的组员基本情况,组内各个成员的研究方向和研究进展做了一个介绍,然后每个同学基于自己当前的研究方向,研究问题和研究内容及研究进展和研究成果对自己这一两年以来的工作情况做了一个汇报。 交流会结束前,实验室的雷凯老师诚挚的感谢了嘉宾们的到来,并对同学们的汇报给予了肯定。随后全体师生和嘉宾进行了合影,本次交流会圆满结束。   详情参见9月10日周一上午-北大深圳互联网中心-开学科研论坛...
Read More

热烈欢迎Stephen J. Song教授,汤步洲教授到我院作学术汇报

2018年 9月5日, 莫纳什大学Monash Biomedicine Discovery Institute (BDI) 的Stephen J. Song教授和哈尔滨工业大学(深圳)计算机科学与技术学院汤步洲教授受雷老师邀请,于当日下午3:30在北京大学深圳研究生院C栋教学楼202室做了一场精彩纷呈的学术报告。沈颖老师,实验室所有学生等前来参加此次讲座。 Stephen J. Song教授演讲的题目是《人工智能在生物大数据中序列标注问题的关键应用》,以通俗易懂的语言给现场师生科普了什么是“生物信息学”之后,介绍了人工智能在蛋白质序列标注的研究进展和应用。教授演讲内容深入浅出,大家听得津津有味,并深刻地意识到:人工智能强大的学习能力和数据分析能力助力人类进一步探索“生命的奥秘”。 汤步洲教授演讲的题目为Chinese Clinical Natural Language Processing Research Status and Chanllenge,介绍了目前中文医疗文本中自然语言处理的研究现状与挑战,并分享了汤教授最近的研究进展:中文医疗文本中的实体识和属性联合抽取。大家看到汤教授多年如一日地深耕中文医疗文本NLP,不禁对汤教授的学者风范肃然起敬。   会议结束后,我院师生与Stephen J. Song教授、汤步洲教授合影,感谢他们此次的分享,希望以后可以有更多交流的机会。 ...
Read More

17级覃孟参加SIGCOMM 2018国际会议

2018年8月20日至25日,实验室17级覃孟同学参加了在匈牙利布达佩斯举行的ACM SIGCOMM 2018国际学术会议(ACM Special Interest Group on Data Communication),并在该会议附属的Network Meets AI & ML (NetAI) Workshop上将实验室最新研究成果与来自全球不同研究领域的学者共同讨论。 ACM SIGCOMM 2018会场     ACM SIGCOMM是计算机网络通信领域的重要学术会议,被中国计算机学会(CCF)列为A类学术会议,主要关注计算机网络通信应用、技术、体系结构和协议等的最新研究成果;同时,今年也是NetAI Workshop在SIGCOMM会议举办的第一届,该workshop主要关注如何利用人工智能技术有效应对现有网络系统的面临的挑战。 本次ACM SIGCOMM会议主要关注投稿论文是否在计算机网络通信领域是否具有: 重要且深刻的贡献 (Important deep contributions); 大胆且新颖的想法 (Daring novel ideas); 较宽广的应用范围和包容性(Breadth of scope and inclusivity)。 最终在222篇投稿论文中选择接收40篇;其中,两篇Best Paper分别为"Sincraonia: Near-Optimal Network Design for Colflows",以及"Inferrin Persistent Interdomain Congestion"。另外,两篇Test of Time Award论文分别为SIGCOMM 2008的"A Scalable, Commodity Data Center Network Architecture"和SIGCOMM 2016的"XORs in the air: practical wireless network coding"。 在会议伊始,主办方简要地总结了近期计算机网络通信领域的几大研究热点,主要包括: 无线网络; 数据中心网络; 机器学习技术在计算机网络领域的应用。 尤其对于机器学习技术的应用,会议的主流观点认为,随着人工智能在近几年的蓬勃发展,其受关注程度远远超过了计算机网络,但计算机网络应该始终保持其作为一个核心研究领域的地位,且应该成为一个不断发展的研究热点。进一步地,NetAI Workshop的主旨也强调,人工智能技术能够用于应对目前计算机网络中面临的挑战;另一方面,计算机网络的前沿技术也能够有效地帮助人工智能系统解决性能瓶颈问题。二者应该相辅相成,共同发展。 会议内容锦集     实验室17级覃孟同学和16级张翼同学在雷老师的指导下,分别在NetAI Workshop上发表长文"Adaptive Multiple Non-negative Matrix Factorization for Temporal Link Prediction in Dynamic Networks"和"IFS-RL: An Intelligent Forwarding Strategy Based on Reinforcement Learning in Named-Data Networking",并分别由覃孟同学和华为2012实验室的白铂老师做论文的口头汇报。 NetAI Workshop报告现场     两篇论文的简介如下: 标题:Adaptive Multiple Non-negative Matrix Factorization for Temporal Link Prediction in Dynamic Networks 作者: Kai Lei, Meng Qin, Bo Bai*, Gong Zhang. 文章链接:https://dl.acm.org/citation.cfm?id=3229546 简介:对于用户移动性、网络动态拓扑和网络流量的预测是改善各种网络系统性能的有效手段,而相关的网络系统动态性预测问题能够以复杂网络分析的观点一般性地抽象为时序链路预测(temporal link prediction)问题。从网络表征(network embedding)的观点出发,提出一种自适应多重非负矩阵分解(adaptive nonnegative matrix factorization, AM-NMF)模型解决上述问题。在非负矩阵分解(nonnegative matrix factorization, NMF)框架下,该模型将动态网络嵌入到一个保留了不同网络快照动态变化特征的低维隐含空间。特别地,由于引入自适应参数自动地调节混合模型中不同分量的相对重要性,该模型还能有效地结合不同时间片下的隐含信息,并考虑单个时间片与动态网络整体的内在关联性。进一步地,关于下一个时间片网络快照的预测结果能够通过执行NMF的逆过程生成。作为一个应用示例,该模型也被应用于各种网络系统相关的数据集,包括人移动网络、车辆移动网络、无线网格网络和数据中心网络。相关实验结果表明,该方法在无权网络和带权网络的时序链路预测任务上的性能超过现有的方法。   标题: IFS-RL: An Intelligent Forwarding Strategy Based on Reinforcement Learning in Named-Data Networking 作者:Yi Zhang, Bo Bai, Kuai Xu, Kai Lei* 文章链接:https://dl.acm.org/citation.cfm?id=3229547 简介:命名数据网络(Named-Data Network, DND)是一种新型的通信范式,它的基本网络原语是基于命名数据而不是主机标识。与传统的IP网络架构相比,NDN的数据传输平面允许每个路由器独立自主地选择下一个转发的接口,而不依赖于具体的路由过程。因此,转发策略在NDN的自适应高效数据传输过程中具有重要的影响。现有的大多数转发策略使用固定的控制规则或基于适用于某些特定部署环境的简单模型,但并不能应用于多种网络场景,也不能应对多样的应用需求。基于增强学习(reinforcement learning),提出一种智能转发策略IFS-RL。通过训练一系列的神经网络,该模型能够根据路由节点收集的Interest包历史转发信息自适应地确定合适的转发接口,而并不依赖于某个预定程序的模型(pre-programmed model)。因此,该模型能够适用于多种不同的网络状态。在基本模型的基础上,也考察了模型的学习力度,并提出一种改进方案使得基本模型能够有效地应对网络拓扑的变化。在NDNSim上的相关性能评价实验结果表明,IFS-RL模型在吞吐量和丢包率方面相比于现有方法具有更好的性能。 通过参加本次会议,不仅了解到了计算机网络通信领域最新研究进展,也充分认识到自身的学术研究能力仍与顶级学术会议有巨大的差距,以及自身研究工作中存在的不足,可谓收获颇丰。在接下来的科研工作中,不仅需要脚踏实地做出具有实质性学术贡献的工作,也需要有挑战国际顶级学术会议和期刊的勇气、魄力和信心。最后,感谢互联网研发中心雷凯老师的资助,以及在论文写作、投稿等方面给予的支持。 ACM SIGCOMM 2019信息 @匈牙利 布达佩斯 多瑙河畔...
Read More