我的第一篇论文是如何诞生的
来自:🌊
一、Idea的产生 1. 灵感来临的夜晚 2020年7月份的某个周五夜晚,刚刚开完组会的我陷入沉思,博士一年级还没开学,怎么大家都已经在讲自己的论文和研究工作了?我还什么都没有呢,每天就只做做项目。之前曾经有一个研究工作,因为陷入了瓶颈,也好久没有继续推进了,因此从硕士毕业以来,一直不知道我的学术之路到底在哪里。 我们组做研究主要的方向,还是偏信管的方向,这意味着首先是以实际的应用为导向的,另外主要还是做计量的分析,即发现一些“什么对什么有什么影响”的这样的研究。说实话,我一直不太感兴趣。而看计算机的论文,我就觉得很有意思,而且计算机方向的研究,让我感觉很有创造力,所以我对计算机的方向,尤其是当今的人工智能方向,一直有执念。曾经也跟导师讨论过,他跟我建议还是做信管方向的研究,毕竟是我们组的专长;曾经也有一些稚嫩的计算机方面的研究点子,也被组里的老师轻松戳破(早被人做过了)。所以,好久以来,我还是挺迷茫的。 那个夜晚,结束组会后,我没有像往常一样直接去休息,而是拿出iPad开始构思一些想法,不知为何当时就有一种预感:“今晚我会想出一个可以做的想法”。近期在企业项目中,一直在做文本分类相关的工作,为了分析模型的结果,常常盯着混淆矩阵看,从中我也发现了一些问题,那就是有一些类别很容易搞混,就一直再想办法解决它。当时就觉得,各个类别彼此之间的相似性是很不一样的,然而分类的时候我们却是假设他们是一样的来分类(one-hot target),这样自然不太好,如果能让模型来训练的时候意识到不同的输出维度存在相似性就好了,于是我立马画了一个草稿:

草稿展示的实际上是一个很简单的想法,那就是手动构造一个soft target,然后用那个去训练模型。写完这个想法之后,我十分地兴奋(虽然后来通过文献阅读发现,学术界早就有类似的想法了),马上开始写相关的代码。第二天也是起的很早就在家里做实验。让我高兴的是,这样朴素的想法,确实是有效的,我在我们项目的数据集上,发现了些许的效果提高。 2. 雏形初现 在我的朴素的想法得到实验的印证之后,我就开始想这个如何能有“学术含量”。因为“人工的”的发不了论文,“智能的”才可以发论文。所以我需要设计一个方法,让我通过人工手段得到的效果提升,可以智能地实现。这个实际上不难,只要是有机器学习、深度学习经验的人,都知道基本的思路就是: “人工构造了什么,就让模型去学习什么。” 所以我前面是自己手工构造的soft target,那我就需要设计模型去学习这个soft target。能达到这个目的的模型设计有很多,但可行的不多,所以我画了很多草图,从原理的角度去查看其可行性。这个时候,之前看过的几篇论文对我产生了极大的提示作用,因此也借鉴了其模型结构。现在回想起来,如果我没看过那篇论文,我也设计不出这样的模型。 设计出来的模型,我又赶紧用代码去实现它,我使用项目的数据集做试验,发现构造出来的模型,也有效果! 此时我的心中已经开始有些按捺不住喜悦了,但我还不急着去找老师分享我的实验结果。为了证明不光光是项目的数据集有效果,我开始在网上收集各种各样的公共的文本分类数据集,中文的,英文的,赶紧都拿来试一试。当我测试到第三个数据集,发现我的方法依然有稳定的提高的时候,我知道,我这个论文,要诞生了!但那个时候,我只敢仰望顶会,感觉像AAAI这种,我还遥不可期,我的想法是把这个idea,写成文章投一投国内的一些新兴的NLP会议,博士开学前先试个水。 我开始整理这几天的实验数据、绘制模型的草图、写下自己的思路,并预约老师讨论。 我依然清晰地记得那一天在小会议室,我激动地、一口气讲完我的研究问题来源、思路、模型设计、实验结果,我感觉无比舒畅。老师认真地听完,没有犹豫,直接告诉我:“我觉得这是一个很有价值的研究,思路很清晰。” 对于这样的评价,我既惊喜,又感觉再意料之中,毕竟我是有备而来。然后我跟老师说,我想投一投SMP(全国社会媒体处理大会)试试,结果老师说:“这么好的想法,不投一个顶会?那岂不是浪费了!投AAAI吧!” 这一句话,比任何对我想法的好评都更加鼓舞人心。因此,我放弃了随便投一投的想法,立志冲击AAAI!
你的回复
回复请先 登录 , 或 注册相关内容推荐
最新讨论 ( 更多 )
- 每天1-2篇文献及总结 (十一)
- 这个真好|华东大二生如何打破信息差? (AAA龙尾虾灯)
- 今日打卡|论文工具分享 (爱吃玉米)
- 肝写论期间整理的文献搜集和免费降重! (船长)
- 今日打卡|Attention Is All You Need (序)