我的植物

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 78|回复: 1

[工作文档] 用python3生成汉语的文字云

[复制链接]

8万

主题

52

回帖

7834

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
7834
发表于 2024-10-1 18:14:57 | 显示全部楼层 |阅读模式
本文,用python把汉语词汇变成文字云图案。




工具/原料
  • 电脑
  • python3.6
  • jieba模块(分割词汇)
  • wordcloud模块


方法/步骤

  • jieba模块可以用pip安装;
    wordcloud模块,需要下载相应的whl文件,然后在使用pip安装。
    lfd.uci.edu/~gohlke/pythonlibs/#wordcloud


    13怎么为python安装wordcloud模块?




    [url=] c255efc595ee41c1c3a82be68d88912ca4ca9b24.jpg.jpg [/url]

  • 准备一个txt文档——test.txt。

    [url=] b666b2530688912cdd455b5d1b4800fc76f79724.jpg.jpg [/url]

  • 准备一个图片:test.png。

    [url=] dda98e4800fc77f7e581d895c8715fdb37209024.jpg.jpg [/url]

  • 读取txt文档:
    f = open('test.txt','r').read()

    [url=] 423041db3620b93a4e06a770ad0f8835dc8a8a24.jpg.jpg [/url]

  • 用jieba分割词汇:
    txt = jieba.cut(f,cut_all = True)


    0用python分割语句(jieba)




    [url=] ccc83ec5260f88355a05de6bce07880139708624.jpg.jpg [/url]

  • 用空格把所有的单词连接为字符串:
    wl = ' '.join(txt)

    [url=] dccb47de45078801b3ff52f4b18ca608a40f8224.jpg.jpg [/url]

  • 用cv2把图像读取为数组:
    mk = cv2.imread('test.png')
    转化为文字云图片。

    [url=] d400248ca608a50f0473d73910cec7f88b77ff24.jpg.jpg [/url]

  • 运行结果如下。
    wordcloud似乎不识别汉字。

    [url=] 9a8fd9f88a775ddd1ec362ffa427e7ef2906f924.jpg.jpg [/url]

  • 指定一个支持汉字的字体文件,就可以识别汉字。

    [url=] 2947750192dd3340287c1632881c99c0aefcf124.jpg.jpg [/url]
    [url=] 9881b1fce186242f0dfd13aa35e434daf15ee824.jpg.jpg [/url]

  • 换个图案。

    [url=] bfa52adaf05e4a23d2fe79a81dd818196020e224.jpg.jpg [/url]
    [url=] 979906196120a7cdbde17c4789b375d7987bdc24.jpg.jpg [/url]




本站全部资源免费下载。开通权限请联系站长管理员

8万

主题

52

回帖

7834

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
7834
 楼主| 发表于 2024-10-1 18:15:19 | 显示全部楼层
在pan.baidu.com/s/1uXwF93LKu5xQMMUbhYoT4A可以下载《汉字文字云.py》,密码是jhgm
本站全部资源免费下载。开通权限请联系站长管理员
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|网站地图|我的植物 ( 京ICP备15066774号-2 )|网站地图

GMT+8, 2026-4-9 05:03 , Processed in 0.036573 second(s), 38 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表