自然语言处理
week1(2020.9.8)
introductions
课程信息:
考勤 10%
平时1、2、3作业 10%/次
期中 20%
课程设计实现 + 论文 40%
***********************************
推荐书籍:
宗成庆《统计自然语言处理》
《统计自然语言处理基础》Christopher.D.Manning
************************************
推荐网站:
https:www.52nlp.cn
************************************
还有就是要提醒大家加入学者网,网址是http://www.scholat.com/course/gwnlp
加入软工1804,密码就是2020
背景知识
一、语言学
包含语音学、音系(这两个都是研究发音)、词法学(词的构成,如前后缀)和句法学(构词成句)等。
二、计算语言学
定义:计算语言学是研究如何利用计算机来理解(encode)和生成(decode)自然语言。
背景:
自然语言:自由度高
人工语言:基于规则,可利用编译原理
NLP与编译原理类似,但是最大的区别是NLP有时候有歧义。
举例:幼儿园/地节目 幼儿园地/节目
顶会:
国际
ACL(最高级的)
EMNCP(注重实验)
国内
CCL
NLPCC
研究方法:
基于规则、基于方法
这学期要掌握的基本算法:
viterbi
Naive Bayes
N-gram language modeling
statistical parsing
inverted index, tf-idf, vector
models of meaning
week2(2020.9.15)
自然语言处理所需要的数学基础 、词法分析(基于规则)





week3(2020.9.22)
上机 正向最大匹配算法
无笔记
week4(2020.9.22)
词法分析(基于统计)


week5(2020.9.22)
词性标注



week6(2020.10.13)
隐马尔科夫模型+维特比算法

还没人转发这篇日记