科研沙龙活动记录(一)
时间:2015.04.09
地点:A栋118室
主讲人:13级候超俊 12级严春伟
主持人:袁梦
参与人员:雷凯老师及13、14级实验室同学

活动内容:
      清明小长假刚刚结束,大家好像还没有完全步入学习正轨,我们本学期第一次科研沙龙今晚成功举办,希望可以让大家在讨论中共同进步,学习别人分享的内容,从中汲取营养。
      第一位主讲人是13级的候超俊同学,他主要的研究内容在NDN的拥塞控制方面。候超俊今天的题目为《The congestion control in network》,他首先简单地介绍了TCP协议,通过TCP中的有限状态机之间的状态变化来着重的介绍TCP中的七种定时器和TCP中连接的建立和销毁。接着提出目前TCP下的拥塞产生的问题,以及如何做好相应的拥塞控制。关于TCP中的拥塞控制,根据慢启动,拥塞避免,快速重传和快速恢复四个阶段分别介绍。最后他介绍了TCP下常用的拥塞控制算法,以及在NDN下做拥塞控制所带来的机遇和挑战。
      候超俊同学生活中幽默风趣,大家可以结识一下这位逗A~哈哈~候超俊分享完毕之后,陶世博和马一宁同学提出了问题。
      首先陶世博同学提出TCP建立连接的时候为什么一定要是三次握手,为什么两次不行?候超俊进行了回答:三次握手的最主要目的是保证连接是双工的,TCP连接中上行路线和下行路线可能是不同的,第一次和第二次握手是为了保证服务端能够接收到客户端的消息,并能正确应答;第二次和第三次握手是为了保证客户端能够接收到服务端的消息,并能正确应答;两次握手无法保证连接是双重的。
      马一宁就图中的一个定义的问题提出了疑问:图中的knee和cliff是什么值,怎么定义的?对此候超俊进行了解答:图中的这两个值,是通过实验得到的,cliff是悬崖的意思,也可以看到在cliff那个地方之后明显降落了。
      接下来是12级的严春伟师兄的讲授,他的主讲题目为《word2vec 原理和应用》。简单介绍了神经网络的相关原理。 之后着重介绍了从统计语言模型到神经网络语言模型的发展过程,以及Word2Vec的几种训练目标和训练方法。之后简单描述了深度学习的基础知识。
      师兄讲完之后,刘辰巍、燕红磊提出了问题。严春伟师兄给出了解释,期间大家讨论的内容很多,希望可以从中有所收获。以下为问答对话:
      刘辰巍问:word2vec与SVM-perf 都能够用来做分类,那从分类的效果上来看,哪一种会比较好呢?
严春伟答:这两种工具从作用上来看,前者,主要是用来学习词向量的,学习词的向量表示,在它的词向量的基础上进行分类和聚类,而且,学习的语料越多,则学习的效果越好。后者主要是用来做分类的,属于机器学习的一种工具,是一种监督式的机器学习的方法,分类效果比较明显,很难说哪种更好,但是,大家用SVM作为一种工具进行分类,是比较常见的。
      燕红磊问:在词向量分类中,神经网络输入跟输出是什么?同时,Word2vec中的滑动窗口大小对结果有影响吗?
严春伟答:运用神经网络,输入是句子,输出是词向量,句子中词的顺序是有影响的。Word2vec中滑动窗口的大小对结果有影响。

附:获奖名单
优胜奖:候超俊
鼓励奖:严春伟
好问题奖:陶世博、马一宁、燕红磊、刘辰巍
PPT、活动录像存放地址:ftp://www.icnlab.cn/BigData/2015-2016year scientific research salon/first20150409/