《Python中文自然语言处理基础与实战》——图书配套资料下载

发布时间：2020-09-24 作者：本站原创浏览量：595

1. 图书简介

本书内容契合“1+X”证书制度试点工作中的大数据应用开发（Python）职业技能高级证书考核标准，全书将理论与实战结合，注重任务案例的学习。本书设计思路以应用为导向，从知识点背景介绍到原理分析，再到任务案例，让读者明确如何利用所学知识来解决问题，通过实训和课后习题巩固所学知识，真正理解并能够应用所学知识。全书大部分章节紧扣任务需求展开，不堆积知识点，着重于思路的启发与解决方案的实施。

全书共12章，第1章介绍了自然语言处理的基本概念、基本流程、应用场景，以及Python自然语言处理开发环境的搭建方法；第2章介绍了语料库的相关知识，包括语料库的概念、种类与准则，NLTK工具包的简介、安装步骤和常用函数，语料库的获取方法等，并演示了语料库的构建与应用；第3章介绍了正则表达式的相关知识，包括正则表达式的函数和元字符，并演示了正则表达式的应用；第4章介绍了常见的中文分词技术，包括基于规则和基于统计的分词技术，中文分词工具jieba的基本步骤和分词模式，并演示了中文分词的应用；第5章介绍了词性标注与命名实体识别技术，包括词性标注的规范，使用jieba进行词性标注和CRF模型的介绍，并演示了中文命名实体识别的过程；第6章介绍了关键词提取技术，介绍了常用的关键词提取算法，并结合具体项目演示了自动提取文本关键词的方法；第7章介绍了文本向量化技术，包括文本的离散表示和分布式表示，并演示了论文相似度计算的方法；第8章介绍了文本分类与聚类技术，包括常见的文本分类算法、文本聚类算法以及实现步骤，并演示了垃圾短信分类和新闻文本聚类的实现过程；第9章介绍了文本情感分析技术，包括情感分析的主要内容、常见应用和常用方法，并演示了基于文本分类和基于LDA模型的情感分析实现方法；第10章介绍了NLP中的深度学习技术，包括循环神经网络、RNN结构和常见的深度学习工具，并演示了使用深度学习技术实现文本分类、情感分析和机器翻译；第11章介绍了智能问答系统，包括问答系统的概念和主要组成部分，并演示了智能问答系统的实现过程；第12章介绍了如何使用TipDM数据挖掘建模平台实现自然语言处理案例。全部章节都包含了思考与练习题，通过练习和操作实践，帮助读者巩固所学的内容。

本书可以作为高校数据科学或人工智能相关专业教材，也可作为机器学习爱好者的自学用书。

微信图片_20211228152022.png

2. 图书配套资料下载说明

方法：打开云教材（https://book.tipdm.org/）,下载对应的图书资源。