(中职)Python编程基础与应用电子课件文本处理库的应用.pptx





《(中职)Python编程基础与应用电子课件文本处理库的应用.pptx》由会员分享,可在线阅读,更多相关《(中职)Python编程基础与应用电子课件文本处理库的应用.pptx(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、(中职)Python编程基础与应用电子课件文本处理库的应用文本处理库的应用主讲:Python编程基础与应用配套课件Python编程基础与应用配套课件编程基础与应用配套课件contents目录1.jieba的安装和简介2.wordcloud的安装和简介3.案例:可视化中文词云项目Python编程基础与应用配套课件编程基础与应用配套课件列表的定义和索引访问列表的定义和索引访问01Python编程基础与应用配套课件编程基础与应用配套课件jieba的简介“结巴”中文分词支持繁体分词,支持自定义词典,还支持四种分词模式:1)精确模式,试图将句子最精确地切开,适合文本分析。2)全模式,把句子中所有的可以成
2、词的词语都扫描出来,速度非常快,但是不能解决歧义。3)搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。4)paddle模式,利用PaddlePaddle深度学习框架,训练序列标注(双向GRU)网络模型实现分词。Python编程基础与应用配套课件编程基础与应用配套课件jieba的安装它的安装方法很简单,可以直接使用PIP进行安装:Python编程基础与应用配套课件编程基础与应用配套课件jieba库的常用函数Python编程基础与应用配套课件编程基础与应用配套课件范例11-1 jieba库的三种分词模式应用jieba库的三种分词模式,对字符串“jieba是优秀的
3、中文分词第三方库”进行分词。Python编程基础与应用配套课件编程基础与应用配套课件范例11-1 jieba库的三种分词模式它的结果 如下Python编程基础与应用配套课件编程基础与应用配套课件wordcloud的安装和简介的安装和简介02Python编程基础与应用配套课件编程基础与应用配套课件wordcloud的安装和简介wordcloud库把词云当作一个WordCloud对象。wordcloud.WordCloud()代表一个文本对应的词云,可以根据文本中词语出现的频率等参数绘制词云,绘制词云的形状、尺寸和颜色都可以设定。它的安装方法很简单,可以直接使用PIP进行安装Python编程基础与
4、应用配套课件编程基础与应用配套课件wordcloud的常用方法在生成词云时,它默认会以空格或者标点为分隔符对目标文本进行分词处理,但是对于中文的文本,分词处理需要我们提前处理好。一般的做法是先将中文文本进行分词,然后以空格或者标点拼接,再调用wordcloud库函数。Python编程基础与应用配套课件编程基础与应用配套课件范例11-2 wordcloud库生成词云应用wordcloud库对以下字符串“Python JAVA C#C+ASP.NET Python and WordCloud Python”生成一个词云,并保存为图片。Python编程基础与应用配套课件编程基础与应用配套课件范例11
5、-2 wordcloud库生成词云它生成了一张图片pywordcloud.png,效果如图。从图中看到“Python”文字比较大,这是因为它的词频是字符串中最高的。Python编程基础与应用配套课件编程基础与应用配套课件生成指定形状的词云wordcloud也可以生成任何形状的词云,为了获取形状,需要提供一张相应形状的图像。图像最好以PNG格式的图片,其它无关的轮廓或者内容提前使用图像处理软件清除好。对于图片的读取可以使用imageio库。imageio是一个Python库,它提供了一个简单的接口来读取和写入大量的图像数据,包括动画图像、体积数据和科学格式。Python编程基础与应用配套课件编程
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 编程 基础 应用 电子 课件 文本 处理

限制150内