时间:2012年10月10日

地点:A118会议室

主讲人:柳胜兵、沙文鹏

主持人:邹凡云

参与人员:黄连恩老师、李大刚老师、实验室全体同学。

活动内容

       主持人介绍本学期科研沙龙活动计划,尤其是强调本学期增加的主讲人鼓励机制以及听众互动的“好问题奖”活跃策略。

       第一位主讲人是柳胜兵。主题是“LDA主题模型及其应用”,主要参考论文为:Latent Dirichlet Allocation。主要从背景、模型描述、参数估计和推导、应用几方面来阐述LDA。着重讲了模型以及公式推导,内容非常深,有很大难度。

       在问答环节,张帆提出两个问题:1,数据量大怎么办?2,EM是不是容易陷入局部最优?针对这两个问题,柳胜兵给出的回答是:离线处理速度不是最重要的,关注速度的时候有在线的LDA算法。已经有人做了。EM确实容易陷入局部最优,初值的选择有时候比较重要,还有其他针对此问题的探索。黄连恩老师就演讲的整体形式提出了建议,希望在该活动中主讲人可以就问题的宏观层面来予以讲述,包括问题的背景产生、应用等,注重问题的整体解决思维;同时也提到了尹文鹏师兄关于LDA方面的研究以及论文成果,这是值得我们学习和作为榜样的。遗憾的是,只有张帆同学提问,所以只产生了一个“好问题奖”,颁给了张帆同学。

科研沙龙活动记录(一)插图

       第二位主讲人是沙文鹏。主题是“Search Computing & LB Service”。他阅读了若干篇相关论文,清晰的讲述了如何将SeCo与LBS相结合来使LBS提供更好的服务,逻辑性强。同学们听的非常认真。在问答环节,大家积极的提问。12级的仇长贺、陈义勇、王嘉炜、杨飞宇以及11级的王思博、秦大洲分别针对多个域搜索的结果如何合并、合并权重如何分配、地理信息是不是也是作为一个域等诸多问题与沙文鹏进行了探讨。现场气氛十分活跃。
由于大家提的问题都非常好,沙文鹏对于三个“好问题奖”难以选择,最终在大家的谦让中,确定为12级的仇长贺、陈艺勇、王嘉炜。

科研沙龙活动记录(一)插图1

       最后是所有听众对两位主讲人根据整个报告的逻辑、内容充实性、表述能力等进行投票。投票方式为:事先发给每人两张牌,花色为一红一黑,红色和黑色分别代表两个主讲人。每人交上红色或者黑色牌,来支持自己更认可的主讲人。最终投票结果是沙文鹏15票,柳胜兵14票。沙文鹏赢得优胜奖,柳胜兵赢得鼓励奖。

科研沙龙活动记录(一)插图2

 

附:

获奖名单

优胜奖:沙文鹏

鼓励奖:柳胜兵

好问题奖:张帆;

              仇长贺、陈艺勇、王嘉炜。

PPT、活动录像存放地址

ftp://www.icnlab.cn/BigData/科研沙龙/第一次 20121010

发表评论

您的电子邮箱地址不会被公开。