2013-2014学年科研沙龙活动记录(一)

微博持续更新中  @北大互联网中心CIRE 时间:2013年10月10日 地点:A118会议室 主讲人:陈艺勇、严春伟 主持人:于倩 参与人员:实验室全体同学。 活动内容: 首先由主持人介绍2013-2014学年科研沙龙线上与线下活动计划,以及相应的主讲人和听众互动的奖励机制。 第一位主讲人是陈艺勇。主题是“paxos及Chubby”,主要参考论文为:Paxos Made Simple。Paxos以及Chubby:The Chubby lock service for loosely-coupled distributed systems。主讲人从背景、基础知识以及应用分别进行了介绍,通过讲解,大家了解到Paxos是一个基于消息传递,在分布式环境下保证数据一致性的模型,其通过在进行数据更改之前先询问数据是否已经被更改这样的形式,保证不会两个进程都修改相同的数据。之后主讲人给出了paxos的一个应用Chubby及其相应概念。在问答环节,大家纷纷针对自己不懂得地方进行了热烈讨论与提问,尤其13级的同学们都在积极互动,其中王如慧、吴迪和欧阳陶旭分别获得了“好问题奖”。 Q&A 摘要提取: (王如慧)问:例子中的延迟请求,在已经选出master之后,为什么还可以被同意?进程发出请求,为什么只发给了两个数据块,这两个是有意义的吗?还是随机的的? 答:这个不是同意,是接收到了信号。是为了节约时间,因此在请求时,只发送给大部分的数据副本即可。 (欧阳陶旭)问:Paxos方法的亮点与优势是什么? 答:通过转发的方式,面向全新的分布式系统。 (吴迪)问:几个进程同时去申请操作数据,一个进程成功获得数据的控制权了,其它进程的请求怎么处理? 答:一个进程获得数据的控制权,那么在一定时间内数据变归该进程所有,其它进程的请求便会拒绝,如果想要操作数据,只能等一定时间后重新申请控制权 第二位主讲人是严春伟。主题是“深度学习简介”。参考文献主要有standford 深度学习教程以及deeplearning.net 网站上相应的内容,清晰的讲述了从浅层机器学习到神经网络到深度学习的发展过程和各自优缺点。讲演过程中,逻辑清晰,表达流畅。同学们听的非常认真。在问答环节,大家积极的提问。12级的陈艺勇以及13级的马一宁、吴迪、张宇骁、候超俊分别针对机器学习、抽取过程和无监督学习与严春伟进行讨论,气氛十分活跃。 最终“好问题奖”确定为13级的马一宁、候超俊以及张宇骁。 Q&A 摘要提取: (马一宁)问:对于deep learning来说,就是逐层进行抽象,那每层抽象的feature是如何选择的?另外是属于无监督的机器学习么? 答:属于无监督的机器学习,feature是根据经验来选择的,每层抽象出来形成“字典”供下一层继续学习。 (候超俊)问:像素是以求和的形式进行窗口取值的,这样反应的数据会不会失真?可不可以以求平均数的形式? 答:这样取值会失真,deep learning的算法就是以牺牲可以接受的数据精度为代价,进行的模型提取,只要取值的数据反应图层的数据就行,所以直接求平均数也是可以的。 (张宇骁)问:deeplearning每一层的重构的具体意义是什么,怎么重构? 答:重构的目的是为了进一步减少信息量,即通过对上一层传来的数据学习得来的抽象出来的元素集合组成的字典中的元素的组合来试图再现上一层获取的数据,用来确定本层所获取的字典或对上层数据的抽象是几乎正确的,而本层的数据量相对于上层则是大大减少了的,是对上一层的归纳抽象,这样逐层减少信息量,最后留下事物的本身特质,比如是人还是猫。具体的方法还待研究。 最后是所有听众对两位主讲人根据整个报告的逻辑、内容充实性、表述能力等进行投票。投票方式为:事先发给每人两张牌,花色为一红一黑,红色和黑色分别代表两个主讲人。每人交上红色或者黑色牌,来支持自己更认可的主讲人。最终投票结果是陈艺勇12票,严春伟11票。陈艺勇赢得优胜奖,严春伟赢得鼓励奖。 附: 获奖名单: 优胜奖:陈艺勇 鼓励奖:严春伟 好问题奖:王如慧、吴迪、欧阳陶旭; 马一宁、候超俊、张宇骁。 PPT、活动录像存放地址: ftp://www.icnlab.cn/Bigdata/2013-2014学年科研沙龙/20131010...
Read More

北京大学互联网信息工程研发中心(深圳)2013-2014年度第一学期科研沙龙活动章程

实验室新浪微博 北大互联网中心CIRE http://weibo.com/u/3782641191 定期更新科研沙龙动态,分享互联网的事儿,实验室的事儿,身边的事儿。 欢迎下载: 北京大学互联网信息工程研发中心(深圳)2013-2014学年科研沙龙活动章程 北京大学互联网信息工程研发中心(深圳)2013-2014学年科研沙龙活动时间记录        ...
Read More

11级王思博同学参加KSEM 2013国际学术会议感受

2013年8月10日开始,我参加了在大连举办的为期两天的KSEM会议。首先非常感谢雷老师能够给予我这次参加会议的机会,让我有机会参加和感受国际高级会议的气氛和风采,充分体现了实验室和老师“以学生为本”的办学理念和教育思想。此次会议之行感受良多,下面我就分享一下此次会议的收获和心得。 Size-Constrained Clustering Using an Initial Points Selection Method 作者:Kai LEI, Sibo WANG, Weiwei SONG, Qilin LI 文章链接:https://link.springer.com/chapter/10.1007/978-3-642-39787-5_16 KSEM会议是人工智能方向下的会议,会议内容侧重于知识科学,知识工程和知识管理领域,同时也涉及到一些数据挖掘方面的东西。第一天听取了几个领域比较知名的学者的讲演,内容侧重于对数据的应用。顾基发老先生毕业于北大数学专业,是运筹学和系统工程方面的专家,曾经同钱学森和许国志开创了中国系统工程的研究与应用。他提出了如何从原始数据中逐步提取出智慧(wisdom)的概念和整个系统工程的框架。主要是逐层提取的过程,首先获取原始的数据(data),例如互联网的大数据,然后从数据(data)中提取出信息(information),再从信息(information)中提取知识(knowledge),最后从知识(knowledge)中提取出智慧(wisdom),从而使城市和世界进入智慧城市和智慧世界。然后又听取和学习了来自波兰和日本的教授在系统知识综合推理方面的学术报告。下午参加了主题为data mining的session,参加讲演的不多,加上我就两个人,一个是k邻近的分类,还一个就是我讲的聚类。          第二天主要听取了两位中国教授的学术报告,都是关于知识管理方面的报告。并参加了web knowledge 的session,都是关于如何从互联网信息提取出有用的knowledge的方法。 下面我将此次执行感受和心得总结如下:  要学会如何给不懂计算机的人讲明白你的想法,首先在准备讲的时候一定要认为,下面听的人都是不懂这个行业的人,由浅入深,这样才能吸引别人。这次的KSEM会议的主要形式就是,先是这个领域的专家做大的演讲,然后再分到下面小的session。从专家那里可以比较清楚的了解他在做什么,完成了什么,想法是什么样的,为什么要这么想。而到了session的时候,基本就是上来直接讲他的论文,听的时候有点无从下手,没有一个过渡的过程。所以如何做好演讲,一定要由浅入深。 要多和参会者多交流,这样才能知道整个领域大家都在研究什么,都在做什么,主要的方向是什么,要积极提问,不要害怕,坚持学术民主的风格。 英语的听说能力很重要,无论是听别人演讲还是自己提问或者交流都需要用英语,日本人和东欧人的英语听起来有点费劲。中国学者说的还是比较易懂的。 其他感想就是,这次会议安排比较人性化和周到,为与会者提供了茶饮,营造了轻松愉快的交流机会和环境。 最后希望我的这次会议感受能够为实验室的项目带来一些启发,以便其能够在雷老师地指导以及实验室的平台依托下,在自己的研究领域中更有创造性的进行下去。 ----王思博...
Read More

实验室11级同学参加国际顶级会议SIGCOMM 2013(Hong Kong)

2013年8月12日,雷凯老师带领实验室11级李立华、彭程、秦大洲、邹凡云四位同学参加了在香港召开的SIGCOMM 2013中的ICN workshop。SIGCOMM是ACM组织在通信网络领域的旗舰型会议,也是目前国际通信网络领域的顶尖会议。 一天的会议下来,一共有11篇论文介绍,涉及ICN架构的各个方面,代表了ICN领域最新的研究进展和研究成果。这次给大家的感受最多的就是要多和其他人交流。这样的顶级会议基本聚集了当今网络领域最顶尖的专家学者,多认识学术领域一些目前和自己研究同一方向的专家学者,和他们交流,能拓宽视野;对于我们提出的问题,大牛们一般都会很热心的回答,尤其是对于他们论文中的疑问。通过交流,可以看到国内外已经有不少潜心研究的学者已经对ICN有了深刻的理解和动手的经验,绝不是仅仅停留在ICN这个新概念的门口。此外,值得一提的是,良好的英语口语能力对于学术交流是非常必要的。 会上得到的主要信息,就是第一届ACM ICN 2014正在筹备于2014年10月在法国巴黎举办,这是ICN连续两年在Sigcom, InfoCom举办了workshop之后,继云计算(Cloud Computing), 大数据(Big Data), 正式进入国际主流学术舞台,说明这一前沿性的研究热点已经逐步升温,走向成熟,这给我们实验室从2010年开始的NDN相关研究提出了更高的挑战、更强烈的吸引力和更强的动力和鼓励。 会议结束,一行五人(彭程、邹凡云、雷凯老师、李立华、秦大洲)在会场前合影留念。 四天后,于8月16日,雷凯老师与11级张凯再次来到SIGCOMM 2013的会场(照片从左到右:张凯,美国Arizona State徐快老师,雷凯老师),参加HotPlanet workshop。 这次参加SIGCOMM顶级会议,鼓励同学们关注国际研究进展,提高学习和科研兴趣。是我们实验室的科学研究和国际接轨的表现,同时体现了我们学院“前沿领域、交叉学科、应用学术、国际标准”的办学特点。 (邹凡云)...
Read More

触摸生活点滴,欢迎2013南燕新秀

       北京大学深圳研究生院(南国燕园),是北京大学创建世界一流大学的重要组成部分,坐落在美丽的鹏城,秉持着一流国际化的办学理念。        初入南燕,也许这里没有熙熙攘攘的三角地,没有风花雪月的未名湖,但是在这里无论是镜湖夜晚的五光十色,还是先进的科学实验室与国际化的师资队伍,都让你感受到一流的学术氛围与浓郁的创新风貌。        为了让新生更加快速而全面的了解南燕,融入南燕。在北京大学信息工程学院互联网实验室雷凯老师的带动下,实验室同学利用自己专业优势,将校园生活的信息搜寻整理,开发了一款手机应用“南燕生活”。该应用从新生视野出发,囊括了交通、购物、美食、住宿、游玩等校园周边实用信息,同时掌上应用让使用者免去了纸质书本沉重的累赘感,只要你想,便可以随时随地了解南燕。 点击此处下载“南燕生活”                同时,实验室同学也开发了一款掌中北大电子杂志,旨在让南燕的师生了解北京校区的人景情,携一份古韵,带一缕清幽,感受燕园这百年来的沧桑变化,体会北大人的“兼容并包”。 点击此处下载“掌中北大”             为了增添校园多姿的生活色彩,现也将实验室开发的其他几款apk应用在这与全院师生进行分享交流,欢迎大家试用与反馈,我们也将根据大家的需求不断更新。 8款电子杂志:    钓鱼岛攻防     香港游     东部华侨城  心脏护理    深港游    著名武器    欢乐谷    高血压保健 2款游戏: 复仇的勇士 愤怒的勇士     注:目前提供的所有apk仅针对安卓系统。...
Read More

11级王思博同学在“深港高校电子竞技精英赛”中荣获实况足球项目团体冠军

2013年5月末至6月初,深圳市云计算关键技术与应用重点实验室(SPCCTA) 2011级硕士生王思博代表北京大学深圳研究生院参加深港高校学子电子竞技精英赛实况足球项目。在经历了校内重重选拔及校际激烈的预赛与决赛后,该队最终荣获冠军。本次电子竞技精英赛自5月25日启动,为期一周。共有来自深港两地高校的11支DOTA项目参赛队和8支实况足球项目参赛队。 本次深港高校学子电子竞技精英赛由中国教育部港澳台事务办公室主办、哈尔滨工业大学承办。深圳高等教育发展办公室、香港大学、香港中文大学、香港科技大学、香港理工大学、香港城市大学、香港浸会大学、北京大学深圳研究生院、清华大学深圳研究生院、深圳大学、南方科技大学、中科院深圳先进技术研究院及哈尔滨工业大学深圳研究生院等深港高校、科研机构共同参与协办。 据悉,国家从2013年开始设立专项资金,实施“香港与内地高校师生交流计划”项目,本次电子竞技精英赛与后续即将举办的“深港高校学子企业家大讲坛”是获批的两个项目。电子竞技精英赛为期9天,除电子竞技比赛外,还包括电子竞技嘉年华、深港学子圆桌会议、交友沙龙及闭幕式暨颁奖典礼等活动。 此次赛事既是展示深港两地交流与发展成果的盛会,又是弘扬公平、公正、积极向上的体育精神的盛会。同时在实验室雷凯老师的支持与鼓励下,丰富了同学们的课余生活,也促进了与港澳学子交流的机会,为学生的全面发展奠定了良好的基础。...
Read More

深圳在职研究生|北京大学|计算机应用|2013年

 北京大学2013年计算机应用技术专业研究生课程进修班(深圳) 招  生  简  章     为帮助在职人员在原有基础上进一步提高学术水平,掌握坚实的理论基础和系统的专业知识,进而更加适应经济建设和社会发展的需要,北京大学深圳圳研究生院在深圳举办计算机应用技术专业研究生课程进修班。2015年北京大学深圳在职研究生网站 一、 招生对象及条件 1、遵纪守法,品行端正,在教学、科研、专门技术、管理等方面做出成绩的在职人员。 2、具有大学本科或大专毕业学历的人员,且毕业后工作三年以上。 3、参加课程班学习并拟申请硕士学位的人员,须已获得学士学位并在获得学士学位后工作三年以上,或虽无学士学位但已获得硕士或博士学位者。已获得的学士、硕士或博士学位为国(境)外学位的,其所获的国(境)外学位需经教育部留学服务中心认证。 二、培养方向及目标 1、培养具有扎实的基础、掌握计算机科学与技术理论、熟悉网络信息工程、多媒体信息处理技术、金融计算、人机交互与机器人系统的专业人才。 2、帮助学员建立在计算机学科方面的厚实功底,特别着重很强的实践应用技能、软件项目管理及现代化信息技术技能提升。 3、发挥北京大学深圳研究生院跨学科优势,打造信息技术与企业管理、相结合的新兴交叉学科和复合型专业。主要面向各级政府机构、企业、事业单位的信息管理部门、电子政务电子商务管理部门、网络系统管理机构、社会各种信息咨询服务机构、计算机企业研发或服务部门、国家各级信息化与信息产业行政主管部门的工作人员及有志于从事信息化资源建设、开发和管理者。培养基础宽厚,有实践能力、创新能力和国际竞争力的从事现代信息产业的高素质复合型专门人才。 三、报名方式及时间 1、报名参加研究生课程进修班学习的人员,可到北京大学信息工程学院(深圳,联系方法见简章底部)索取招生简章,咨询有关问题,进行报名登记。 2、网上报名:https://www.icnalb.cn/baoming/ 3、报名时间为2013年6月1日至 8月25日。 四、资格审查及确认 1、我院(系)将对报名参加学习的人员按招生条件进行资格审查。报名人员须提交的材料:①单位人事部门介绍信;②学历学位证书原件及复印件;③身份证原件及复印件;④相关工作业绩及科研成果证明材料。 2、报名人员应在我院(系)规定的报名时间内,到深圳市南山区西丽大学城北京大学深圳研究生院A栋120房间(0755 - 26032574, 0755 - 26032414)提交报名材料,进行资格确认。 五、业务考核及录取 1、根据考核成绩,参考工作业绩和有关科研成果,择优录取。 2、将初步录取名单报研究生招生办公室审查批准后,发放录取通知书。 六、课程设置及学分 1、必修课( 8门,共24学分): (1)  算法分析和复杂性理论             (5) 高等计算机体系结构 (2)  面对对象程序设计                   (6) 网络、群体与市场 (3)  数字媒体技术基础                   (7) 科学素养与研究方法 (4)  信息技术产业导论                   (8) 无线网络与移动计算技术 2、选修课( 2门,共6学分): (1)  模式识别导论                       (4)  网络信息体系结构 (2)  智能机器人技术                   (5)  嵌入式系统设计与实践 (3)  金融计算                                 (6)  数字图像处理 七、教学方法及考试 1、教学方法:采取理论与实践相结合、集中讲授与自学相结合的学习方式,发讲授提纲和教材,规定必读与参考书,每半年时间讲授3-4门专业课,利用业余时间上课(周六、周日或该周工作日晚上)。 2、考试方式:(1)、录取时确定了以同等学力申请硕士学位资格的人员,专业基础课和学位核心课程(6门),由研究生院统一组织闭卷笔试,时间一般为每年的四月和十一月,其它课程由相关院系组织考试。(2)、不申请学位的人员,全部课程由各院系组织考试。 八、学习年限及收费 1、学习年限为一年半。 2、学费为45000元,在第一年入学注册时交33000元(其中学费30000元,英语辅导费3000元)和第二学年开学时交15000元,分二次交清。学员注册缴费后如中途退学不再退费。学费只含上课费和正常组织的考试费,不包括申请学位人员进入论文阶段后的费用。 九、学员结业及证书 1、研究生课程进修班的学员,完成培养方案所规定的课程,考试成绩合格者(60分以上)即可结业。 2、结业学员名单和成绩报经研究生院审查核准后,颁发由北京大学研究生院盖章的《研究生课程进修班结业证书》。 十、申请学位及办法 1、申请学位按照北京大学学位办公室关于以研究生毕业同等学力申请硕士学位的规定办理。 2、拟以研究生毕业同等学力申请硕士学位的人员,须在报名参加研究生课程进修班的同时提出申请,我院(系)将按照在职申请学位的有关规定进行资格审查。 3、课程考试成绩达到70分以上为合格,可获得相应学分。 4、国家统一组织的外语和综合考试,费用按规定由学员交纳。 5、我院(系)将为学员安排教师进行学位论文的指导。 十一、联系方式及地址 1、北京大学深圳研究生院 北京大学信息工程学院(深圳) 地址:深圳市南山区西丽大学城北大校区A栋120室,邮编518055 联系电话:0755-26032574, 0755-26032414 主页:http://www.pkusz.edu.cn/,http://www.ece.pku.edu.cn/, http://www.pkuece.cn  2、北京大学研究生招生办公室, 电话:62751354 , 地址:北京大学红二楼一层2104房间 ,邮编:100871 ,主页地址:http://grs.pku.edu.cn/zsxx/kcbzs/ 3、北京大学学位办公室, 电话:62751361 , 地址:北京大学红二楼二层2212房间 ,邮编:100871 ,主页地址:http://grs.pku.edu.cn/xwyxk/xwsy/tdxlsqxw/ 北京大学深圳研究生院                               2013年 6月5日...
Read More

科研沙龙活动记录(十)

时间:2013年6月3日 地点:A118会议室 主讲人:廖文静、严春伟 主持人:邹凡云 参与人员:雷凯老师、黄连恩老师、实验室同学 活动内容: 第一位主讲人是12级廖文静。主题是“Naive Learning in Social Network and the Wisdom of Crowds”。复杂社会网络在什么条件下才能形成一个一致的意见,也就是群体智慧得到体现?只有当网络中没有极度不平衡的节点,也就是没有很权威、影响力很大的节点,也没有以自我为中心对外部其他节点信赖很低的节点的时候才可以。最终“好问题奖”确定为陈涛、夏睿、王思博。 Q&A摘录: (陈涛)问:论文中的第二种网络是不符合论文假设和定义的么,定义中参数r是否是人为给定的? 答:不符合论文对网络的定义,r是给定的某个大于0的值。 (夏睿)问:引言部分的计算模型? 答:这个比较复杂,但是课程的参考书上有。 问2:最后的两个评价标准的关系? 答:不是完全相斥的关系,但是作者也没有给出等价的一个推导。 问3:收敛的递推模型是怎么样的? 答:其实有很多递推模型可以选取,作者选择了一个比较好展示递推过程的模型。 (王思博)问:μ是客观存在的?还是假设的? 答:假设出的平均值,当做是客观存在的。 第二位主讲人是12级严春伟。主要讲了从kddcup2012看微博推荐,利用additive forest和svd组合模型建模。最终“好问题奖”确定为张凯、张腊梅、仇长贺。 Q&A摘录: (张凯)问:交大的算法在做参数学习的时候是采用的cross-validation吗? 答:应该是,但是交大没有说明。他们只公布了源码,而且非常难以阅读。 (张腊梅)问:各种参数如何融合到一起? 答:根据两个公式对矩阵数值根据加入的特征进行调整。 (仇长贺)问:SVD和累加森林是通过横向还是纵向的方法组合到一起的?对于每个item都要计算类似于决策树的这个方法? 答:通过横向线性的方法组合到一起,对于每个Item都要计算一遍。 最后是所有听众对两位主讲人根据整个报告的逻辑、内容充实性、表述能力等进行投票。:最终投票结果是廖文静11票,严春伟10票。廖文静赢得优胜奖,严春伟赢得鼓励奖。   附: 获奖名单: 优胜奖:廖文静 鼓励奖:严春伟 好问题奖:陈涛、夏睿、王思博; 张凯、张腊梅、仇长贺。 PPT、活动录像存放地址: ftp://www.icnlab.cn/BigData...
Read More

互联网中心成立10周年,校友通讯录

各位互联网中心毕业的校友们: 十年,弹指一挥间,我相信大家从互联网中心毕业以后,一定在事业上和生活上都取得极大的进步和发展。我们中心从03级同学第一级招生以来,一步一步不断发展和壮大,逐步树立起了自己的品牌和影响力,目前已经是深圳市级重点实验室,这些都来至于每届同学的努力和贡献。 互联网中心从无到有,从起步到发展,从提升到壮大,马上就要迎来她的十年生日。请大家记住6月16这个日子,这个是03级同学2004年到达深圳的日子,这也是05年我们深圳推出自己研发的第一款Maze的日子,虽然我们目前的研究领域已经有的较大的变化、拓展和提高。但是,那些美好的回忆还是值得我们去庆祝和骄傲。 为此,我们做了一个简单的中心校友通讯录:https://www.icnalb.cn/alumnus/(请用你们之前的学号登陆),邀请大家更新一下最新的情况的联系办法,促进校友同学之间的联系和交流,同时也很诚挚地希望大家反馈一下各自的情况和对实验室建设的建议。 由于我手上的大家的联系办法可能不是最新的,也不全。【还请收到的同学转发给同年级的其他同学,“社会网络”一下】。我也非常希望大家毕业之后,也互通有无,有机会来深圳,回实验室看看,看看你们曾经学习和工作的地方,看看现在南燕和实验室的变化,给还在就读的学弟学妹们分享你们的经历和故事,帮助实验室的进一步进取和创造新的篇章。 谢谢! 雷凯, 2013.5.20...
Read More

科研沙龙活动记录(九)

时间:2013年5月14日 地点:A118会议室 主讲人:曾一凡、沙文鹏 主持人:邹凡云 参与人员:雷凯老师、黄连恩老师、实验室同学 活动内容:        第一位主讲人是10级曾一凡。主题是基于NDN协议的DHT算法设计。首先介绍了DHT的基础概念,接着以经典DHT算法——Chord为例说明DHT的大概工作原理,最后详细说明基于NDN网络而设计的DHT算法——ndnDHT,包括key空间设计、命名设计、节点上下线机制等。最终“好问题奖”确定为秦大洲、李立华、彭程。 Q&A摘录: (秦大洲)问:对于节点规模大小的估计方法是不是错误的可能比较大? 答:由于是随机的,确实会出现估计偏差,我还有一个方法,但是由于时间关系就没有采用。 (李立华)问1:命名规则中广播类的interest主要用在什么地方?不考虑这类包有没有影响? 答1:没有。可以去掉不考虑的。 问2:DHT可不可以解决NDN中的广播问题呢? 答2:应该可以。 问3:那是限制性广播好还是DHT方法好呢? 答3:现实的应用中应该很少用广播。除非是小范围的系统中,可以考虑。 (彭程)问:如果设计实现一个DHT算法,当内网的节点上线以后,如何与公网的前驱节点进行通信? 答:这是一个实际问题,可能在实现中会增加负责穿透的内网服务器,帮助节点上线后之间的通讯。 第二位主讲人是11级沙文鹏。主题是“rank join problem”。rank join问题被广泛应用于信息检索领域。本次报告涉及rank join问题的定义以及一般性解法。同时介绍了proximity rank join问题,这是一种将相似性引入rank join问题的新模型。最后介绍了如何将proximity rank join问题应用于LBS的情景内。最终“好问题奖”确定为宋学辉、于倩、廖文静。 Q&A摘录: (宋学辉)问:计算两个实体的距离时,将交通或时间考虑进去是否更合理? 答:考虑过这方面使距离评估更合理的方法,不过这个对模型影响不大,简单起见只考虑了距离。 (廖文静)问:论文中各点之间不是欧氏距离,而用实际距离,实际距离是如何获得的? 答:采用了baiduAPI,如果用在实际中,应该要想其他解决办法,因为等待其他接口返回数据的等待时间太长。 (于倩)问:现在利用这种混合性搜索有成型的应用吗? 答:目前为止主要在探索阶段,并且在一定程度上依赖于数据库和自然语言处理方面的技术。 最后是所有听众对两位主讲人根据整个报告的逻辑、内容充实性、表述能力等进行投票。:最终投票结果是曾一凡8票,沙文鹏10票。沙文鹏赢得优胜奖,曾一凡赢得鼓励奖。在此次沙龙快结束的时候,两位老师与沙文鹏同学又进行了更深刻的讨论,让人意犹未尽。   附: 获奖名单: 优胜奖:沙文鹏 鼓励奖:曾一凡 好问题奖:秦大洲、李立华、彭程;               宋学辉、于倩、廖文静。 PPT、活动录像存放地址: ftp://www.icnlab.cn/BigData...
Read More