《Python中文自然语言处理基础与实战》——图书配套资料下载

发布时间:2020-09-24 作者:本站原创 浏览量:595

1. 图书简介

本书内容契合“1+X”证书制度试点工作中的大数据应用开发(Python)职业技能高级证书考核标准,全书将理论与实战结合,注重任务案例的学习。本书设计思路以应用为导向,从知识点背景介绍到原理分析,再到任务案例,让读者明确如何利用所学知识来解决问题,通过实训和课后习题巩固所学知识,真正理解并能够应用所学知识。全书大部分章节紧扣任务需求展开,不堆积知识点,着重于思路的启发与解决方案的实施。

全书共12章,第1章介绍了自然语言处理的基本概念、基本流程、应用场景,以及Python自然语言处理开发环境的搭建方法;第2章介绍了语料库的相关知识,包括语料库的概念、种类与准则,NLTK工具包的简介、安装步骤和常用函数,语料库的获取方法等,并演示了语料库的构建与应用;第3章介绍了正则表达式的相关知识,包括正则表达式的函数和元字符,并演示了正则表达式的应用;第4章介绍了常见的中文分词技术,包括基于规则和基于统计的分词技术,中文分词工具jieba的基本步骤和分词模式,并演示了中文分词的应用;第5章介绍了词性标注与命名实体识别技术,包括词性标注的规范,使用jieba进行词性标注和CRF模型的介绍,并演示了中文命名实体识别的过程;第6章介绍了关键词提取技术,介绍了常用的关键词提取算法,并结合具体项目演示了自动提取文本关键词的方法;第7章介绍了文本向量化技术,包括文本的离散表示和分布式表示,并演示了论文相似度计算的方法;第8章介绍了文本分类与聚类技术,包括常见的文本分类算法、文本聚类算法以及实现步骤,并演示了垃圾短信分类和新闻文本聚类的实现过程;第9章介绍了文本情感分析技术,包括情感分析的主要内容、常见应用和常用方法,并演示了基于文本分类和基于LDA模型的情感分析实现方法;第10章介绍了NLP中的深度学习技术,包括循环神经网络、RNN结构和常见的深度学习工具,并演示了使用深度学习技术实现文本分类、情感分析和机器翻译;第11章介绍了智能问答系统,包括问答系统的概念和主要组成部分,并演示了智能问答系统的实现过程;第12章介绍了如何使用TipDM数据挖掘建模平台实现自然语言处理案例。全部章节都包含了思考与练习题,通过练习和操作实践,帮助读者巩固所学的内容。

本书可以作为高校数据科学或人工智能相关专业教材,也可作为机器学习爱好者的自学用书。

微信图片_20211228152022.png

2. 图书配套资料下载说明

方法:打开云教材(https://book.tipdm.org/),下载对应的图书资源。