(中职)Python编程基础与应用实训任务书-0901“结巴”中文分词库的使用(工信版).docx
-
资源ID:76722110
资源大小:373.66KB
全文页数:10页
- 资源格式: DOCX
下载积分:10金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
(中职)Python编程基础与应用实训任务书-0901“结巴”中文分词库的使用(工信版).docx
实训任务:“结巴”中文分词库的使用学校名称:班级名称:学号/工号:学生姓名:实训日期:1实训目的(1) 了解jieba库的基本功能(2) 熟练掌握jieba库的安装(3) 熟练掌握jieba库的常用函数使用,包括:jieba.lcut(s)、jieba.lcut(s,cut_all=True)、jieba.lcut_for_search(s)、jieba.add_word(w)(4) 掌握jieba库的三种分词模式的应用2实训环境普通电脑,并安装以下软件:(1) Windows 7(或者以上版本)操作系统 (2) PyCharm软件(3) Python 3.8以上版本3实训内容任务一:jieba库的三种分词模式的训练1、任务内容(1) 编写程序,应用jieba库的三种分词模式,对字符串“jieba是优秀的中文分词第三方库”进行分词。函数名称描述jieba.lcut(s)精确模式,返回一个列表类型。jieba.lcut(s,cut_all=True)全模式,返回一个列表类型。jieba.lcut_for_search(s)搜索引擎模式,返回一个列表类型。jieba.add_word(w)向分词的词典增加新词w。(2) 要求关键代码做好注释,效果如下图所示2、任务提交要求(1) 提交任务运行的截图,放在下面(2) 提交任务的代码3、参考答案及解析解析略任务二:英文文本解析1、任务内容编写程序,对一个txt格式的英文文章(比如english.txt)进行文本解析。(1) 程序提示输入一个英文文章的路径。(2) 打开该文件,并读取全部内容。读取文件时请注意字符的编码格式。字符转换为小字,并把特殊字符“!"#$%()*+<_>/:;<>=?_|”删除。(3) 进行分词和统计,把前10个高频词显示出来。(4) 要求关键代码做好注释2、任务提交要求(1) 提交任务运行的截图,放在下面(2) 提交任务的代码3、参考答案及解析解析略任务三:中文文本解析1、任务内容编写程序,对一个txt格式的中文文章(比如学习强国简介.txt)进行文本解析。(1) 程序提示输入一个中文文章的路径。(2) 打开该文件,并读取全部内容。读取文件时请注意字符的编码格式。(3) 进行分词和统计,把前10个高频词显示出来。在分词时需要使用liebiao=jieba.lcut(txt) 进行分词。(4) 要求关键代码做好注释2、任务提交要求(3) 提交任务运行的截图,放在下面(4) 提交任务的代码3、参考答案及解析解析略4实训心得体会