分享 | AI技术俱乐部第一届、第二届华山论剑

中大HCP实验室

上回说到，求贤若渴的AI俱乐部招贤纳士，收获了一批实力满满的新成员！

那么怎么从江湖小虾米快速成长为武林高手呢，当然是参加一周一度的华山论剑啦！

第一届华山论剑

来自NLP派的大师兄唐鉴恒深入浅出地为大家讲解了本派要义。

唐鉴恒自然语言处理介绍

鉴恒师兄简要介绍了自然语言处理面临的挑战，包括词语的多义性、句子的深层含义等，接着讲解了单词在计算机中的表示方法，如One-hot编码、GloVe等词向量模型，以及自然语言处理的经典算法，包括对序列建模的循环神经网络和Attention机制，最后举例展示了问答系统、对话系统等自然语言处理的实际应用。

来自CV派的肖遥师兄将小虾米们领入ML的大门。

肖遥机器学习基础

肖遥师兄不仅为大家介绍了机器学习入门的基础知识，内容涵盖了机器学习的基本概念、Logistic回归等一些核心算法以及思想，更是推荐了周志华老师的《机器学习》、Ian Goodfellow的《深度学习》等教材书籍供同学们选择学习。相信同学们在师兄的带领下可以快速入门ML~

什么？

竟然有人反馈听的不过瘾，很快就消化完了？

那不要紧

第二届华山论剑一定能让你大快朵颐~

第二届华山论剑

机器人派掌门人王锡淮演示了一套名为Imitation Learning的剑法，据他所言，此乃机器人派的开山剑法

王锡淮模仿学习

锡淮师兄带来了模仿学习的相关介绍，介绍了行为克隆，逆强化学习，以及在此基础上衍生出的最大熵深度逆强化学习等几种方法，接着引出为了解决误差问题提出的数据增广、Dagger等方法，进一步介绍了非马尔可夫行为、多模型行为等导致专家数据拟合失败的现象，（Limited Capacity），最后是对抗神经网络在模仿学习中的应用。

而我们的欧阳梅子主席则是讲解了一本剑谱，该剑谱名为Preferences Implicit in the State of the World，老夫得知，该剑谱藏于此山中：https://arxiv.org/abs/1902.04198 有志向学Reinforcement Learning的侠客可到此山中探宝。

欧阳梅子论文分享

梅子师姐分享的这篇论文基于一个根本观点：在强化学习中，设计合理正确的reward函数非常重要，但往往人为设计的reward函数会存在许多不完善的地方，从而导致智能体无法很好的学习到人们想要的行为。论文中指出，当机器人被部署于一个有人类参与的环境中时，环境状态已经因人类所需而完成优化，此时世界的初始状态会包含一些隐含的人类偏好。充分考虑这些隐含的偏好，智能体能够实现对任务的推理。建议有兴趣的大侠们去阅读原文。

梅子师姐还讲解了强化学习的一些基本概念，以及通过一个生动有趣的游戏例子介绍了Q-learning算法。并鼓励各位大侠自己尝试用强化学习算法实现一个小游戏。

接下来是由后起之秀——进阶组的欧子菁同学展示了他对于Adversarial Examples in NLP的理解。

欧子菁自然语言处理中的对抗样本

欧子菁同学首先介绍了对抗样本的概念、在计算机视觉方面的应用以及工作原理，接下来推演了对抗样本的训练方式以及这种在嵌入空间中加入对抗性扰动的方法如何迁移到自然语言处理领域，再是在语言模型中使用MH方法（Metropolis-Hastings，一种蒙特卡洛-马尔科夫链算法）、对词语的插入、删除、替换操作使用对抗样本的过程，最后欧子菁同学还就AI安全方面提出了自己的见解，赢得了阵阵掌声。

武林前辈吴老师亲临华山，在肯定了众高手的剑法之精后，也帮助我们将江湖新秀们分列不同门派。十年磨一剑，还望各位后生勤加练习，早日成为武林高手，独领风骚！

（鞠躬）

最后，全员合照，武林一统~

来源 | AI技术俱乐部智能工程学院 18级智科一班林潇涵

编辑 | 刘诗

一审 | 欧阳梅子

二审 | 侯雪莹

中山大学AI技术俱乐部

2017年春，中大AI技术俱乐部在数据科学与计算机学院及学生学术发展中心的支持下成立。俱乐部以中山大学人机物智能融合实验室HCP Lab为学术依托，旨在为热爱人工智能的中大学子提供一个广阔的学习、交流平台，共同推动人工智能技术的发展。

在过去的两年半间，我们已为第一、第二届会员举办了若干学术交流活动：如实验室提供的课程培训和科研实训、十余次商汤科技技术讲座、定期学术Seminar、线上Talk，Kaggle比赛……

与此同时，俱乐部公众号至今已累积了2000+粉丝，为同学们分享各类技术原创文章、推荐技术干货、更新俱乐部动态，共发布数百篇文章。在学院、中心、实验室、暗物质AI等多方支持下，我们所举办的活动获得了同学们的好评，也吸引了越来越多期待加入的目光……

继续滑动看下一个