时间:2013年3月12日

地点:A118会议室

主讲人:仇长贺、张志明

主持人:邹凡云

参与人员:雷凯老师、黄连恩老师、实验室全体同学。

活动内容

这是本学期第一次科研沙龙,雷凯老师和黄连恩老师到场聆听指导,同学们听的认真,讨论的也非常积极。

第一位主讲人是仇长贺。主题是Intrusion as (Anti)social Communication:Characterization and Detection。这是KDD2012最佳学生论文,文中采用了新颖的方式检测网络中的恶意主机。利用社交网络文化中图的分析和割点的概念,来描述和检测入侵。讲完后,雷总对最近在研究NDN中DDoS方面的陈涛同学提了问题,思考这个方法是否适用于NDN。王嘉炜认为由于NDN中没有端到端主机的概念,所以答案是否定的。对于同学们来讲,听主讲人讲非自己研究方向的知识,不仅能拓宽视野,同样也有可能促进交叉研究思路。大家讨论非常热烈,最终“好问题奖”确定为廖文静、夏睿、秦大洲。

Q&A摘录:

(廖文静)问:论文中采用的检测方法比原来方法好在哪里,最后是否有实验对比?

答:论文从社会网络的角度看待和分析入侵检测问题,实验只对比了传统的采用出度的方法,结果证明比这种方法效果好很多。

(夏睿)问1:社交群体圈的概念是怎么定义的?

答:按照连入某个目的主机的所有主机组成初始的一个群体,然后,通过删除割点,设置阈值的方式,进一步处理。

问2:对于本来是割点,删除割点以后,不是割点的点,怎么处理?

答:就当做不是可疑点。

(秦大洲)问:置信区间95%的范围是(..)到底是一个怎么样的情况?

答:是表示错误在(..)区间内的可信度能达到95%,是个不错的可被接收的情况。

科研沙龙活动记录(六)插图

第二位主讲人是张志明。主题是“支持向量机”。主要介绍了三种支持向量机:硬间隔—支持向量机、软间隔—支持向量机、非线性支持向量机。讨论了如何由原问题转化为对偶问题,原问题转化为对偶问题的手段是Lagrange函数,并介绍了核函数及其优点和工作机制。最后讨论了支持向量机的应用。最终“好问题奖”确定为张帆、夏睿、杨飞宇。

Q&A摘录:

(张帆)问:如果训练集是几百万的文档数据,而特征是几十万的词,那利用对偶问题求解(与训练集规模有关)是否比直接求解原问题(与特征维数有关)更复杂了?

答:一般地,不需要如此多的文档进行训练,通过随机抽取一小部分文档训练即可;而特征维数则是不可控的,通常特征维数越高越利于分类,所以特征维度一般要比训练集规模大得多。

(夏睿)问1:关于原方程和对偶函数的复杂度的关系。

答:原函数是根据维度,对偶函数是根据数据样本的个数。

问2:RBF是否会出现分类属于一类的情况?

答:会的,因为很可能尝试不出好的核函数,最后变换到某个维度空间,在这个空间中,它们混杂在一起。

问3:SVM适合小样本吗?

答:几百的小样本可以尝试使用SVM来处理,比一般的算法效果要好。这可能是由于对偶函数的变换作用。

(杨飞宇)问:如何实现从低维映射到高维时能够保证实现非线性到线性的转化?

答:这个映射关系是隐式实现的,需要多次设计核函数进行不断地实验才能成功。

科研沙龙活动记录(六)插图1

最后是所有听众对两位主讲人根据整个报告的逻辑、内容充实性、表述能力等进行投票。:最终投票结果是张志明11票,仇长贺8票。张志明赢得优胜奖,仇长贺赢得鼓励奖。

 

附:

获奖名单

优胜奖:张志明

鼓励奖:仇长贺

好问题奖:廖文静、夏睿、秦大洲;

张帆、夏睿、杨飞宇。

PPT、活动录像存放地址

ftp://www.icnlab.cn/BigData

发表评论

您的电子邮箱地址不会被公开。