本节课结合了旧版的前半部分(NLP的基本概念的内容)以及新版的绝大多数内容。 0. 本节课程计划 NLP的基本概念和人类语言的本质。 什么是深度学习。 课程安排。 为什么NLP难? NLP的应用。 1. NLP的基本概念 1.1 什么是NLP? NLP是计算机科学、人工智能、语言学的交叉学科。 它的目标是让计算机理解人类语言,从而完成有意义的任务。例如: 下订单或者买东西 知识问答,如Siri、谷歌助手、微软小冰等 完全理解和表达语言的内涵是极其困难的,完美的语言理解等效于实现完备的人工智能系统。 1.2 NLP的层次 语言的输入有两种方式,一种是语音识别,一种是文本(OCR和分词)。接下来是形态学(Morphology),简单可理解为对英文单词进行形态变换,如act->action。 接下来是语法分析和语义分析。最后是篇章处理,它更加注重于通过上下文进行理解。 本门课主要注重于画圈的三大部分,尤其是后两部分(语法分析和语义分析)。 1.3 自然语言处理应用 推荐和广告依然是AI在互联网行业落地最早也最为成熟的两个方向。所以将NLP技术利用于这两个方向也是顺其自然的事情。具体来说: 搜索(拼写自动纠正) 在线广告匹配 现如今NLP最火热的两个方向分别是知识图谱和智能客服(聊天机器人)。 1.4 人类语言的特殊之处 自然语言与信号处理