python 中文jieba分词_jieba返回频度-程序员宅基地

技术标签: 笔记 知识点总计  笔记  

import os
import jieba
from collections import Counter


def words(txt):
    print(jieba.cut(txt))
    lista = jieba.cut(txt) #返回的结构都是一个可迭代的 generator,可以使用 for 循环来获得分词后得到的每一个词语(unicode)
    c = Counter()  #用于追踪值的出现次数
    for num in lista:
        if len(num) > 1 and num != '\r\n\t':
            c[num] += 1
    print('常用词频度统计结果')
    for (k, v) in c.most_common(100):
        print('%s%s %s  %d' % ('  ' * (5 - len(k)), k, '*' * int(v / 3), v))


if __name__ == '__main__':
    txt = ""
    with open('wudong', 'r',encoding='utf8') as fp:
        txt = fp.read()
    words(txt)

 

 

11

代码参考自:(

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/onestab/article/details/78307765

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/AYER_/article/details/100642392

智能推荐

通过字节码混淆来保护Python代码_<0x02><0x90>-程序员宅基地

文章浏览阅读2.7w次,点赞19次,收藏35次。Python开发者常常面临这样一个难题,即如何保护代码中的技术秘密。笔者尝试过的一些Python代码保护工具要么难以有效实现该目标,要么有效但是有着不可忽视的缺点。本文首先对常见的Python代码保护机制以及几个比较容易获得的Python代码保护工具进行了简单的分析,然后展示了通过字节码混淆来保护Python代码的技术原理。_<0x02><0x90>

数据结构实验之图论四:迷宫探索_4连通迷宫acm-程序员宅基地

文章浏览阅读341次。数据结构实验之图论四:迷宫探索Time Limit: 1000MS Memory limit: 65536K题目描述有一个地下迷宫,它的通道都是直的,而通道所有交叉点(包括通道的端点)上都有一盏灯和一个开关;请问如何从某个起点开始在迷宫中点亮所有的灯并回到起点?输入连续T组数据输入,每组数据第一行给出三个正整数,分别表示地下迷宫的结点数N(1 &lt; N &lt;= 1000..._4连通迷宫acm

ios 系统状态栏样式修改_iOS设置状态栏样式-程序员宅基地

文章浏览阅读347次。标签:状态栏样式,statusBarStyle状态栏的样式系统的默认样式是黑色的,但可以修改,方法有2种方法1:// 返回状态栏的样式- (UIStatusBarStyle)preferredStatusBarStyle{return UIStatusBarStyleLightContent;}// 控制状态栏的现实与隐藏- (BOOL)prefersStatusBarHidden{return..._怎么改成苹果的状态栏

org.xml.sax.SAXParseException: cvc-elt.1: Cannot find the declaration of element 'beans'._cvc-elt.1.a: cannot find the declaration of elemen-程序员宅基地

文章浏览阅读1k次。1 org.springframework.beans.factory.xml.XmlBeanDefinitionStoreException: Line 10 in XML document from class path resource [applicationContext.xml] is invalid; nested exception is org.xml.sax.SAXParseE..._cvc-elt.1.a: cannot find the declaration of element 'beans'.

maven当中<type>pom</type>和<scope>import</scope>和< dependencyManagement>的用法maven的继承和引用到底怎么用的_<type>pom</type>-程序员宅基地

文章浏览阅读3.5k次。maven当中避免重复发明轮子的方法,一种是继承,一种是引用(参考我参考目录下的文章)。maven中配置引 用关系的方法是,<type>pom</type>和<scope>import</scope>,很 简单,这样就引入一个pom文件,这样<dependencies>里面的<groupId> org.springframew..._pom

功能强大,颜值在线的个人笔记应用 - Notion_notion getting start-程序员宅基地

文章浏览阅读667次。无论在学校还是工作中,记笔记都是让生活高效有序的有效方式。常见的个人笔记软件包括: 微软的OneNote 国产的印象笔记 今天,我们将要介绍一款IOS扁平风的宝藏App - Notion。本文是一篇个人向的点评,从实际使用及个人偏好出发,仅代表个人观点。1 OneNote作为微软出品,它有着一如既往的Office风格,说不上丑也说不上好看。可个人使用,也可作为企业团队协作或知识共享的平台。功能不算强大,算是一款无功无过的企业级标准产品。2 印象笔记(Evernote)_notion getting start

随便推点

Laravel中使用webhook开发Telegram机器人自定义指令_laravel 开发的问答机器人-程序员宅基地

文章浏览阅读2.6k次。创建Telegram机器人与@BotFather交谈,或者点击链接 : https://telegram.me/BotFather点击Start点击 /newbot输入机器人名称 name,设置后可以修改输入机器人用户名 username,必须以bot结尾,被@和搜索的名字,设置后无法修改得到API Token创建command指令点击/mybot点击Edit Bot点击Edit Commands输入命令列表:command1 - 描述command2 - 描述例如._laravel 开发的问答机器人

ESP32 TTGO 1.14寸液晶屏使用 TFT_eSPI库驱动_esp ttgo-程序员宅基地

文章浏览阅读1w次,点赞14次,收藏105次。ESP32 TTGO1、屏幕驱动常用API2、示例代码ESP32 TTGO开发环境:VS Code (便于查看函数)  ESP32 TTGO一块高颜值的开发板,自带1.14寸屏幕使用ST7789驱动,使用TFT_eSPI库。文档链接:https://github.com/Xinyuan-LilyGO/TTGO-T-Displaygithub下载文件,拷贝到自己的arduino 库文件里面就可以使用了。下图所示引脚分配:1、屏幕驱动常用API实例化屏幕:TFT_eSPI::TFT_eS_esp ttgo

ESP32 & Tensorflow Lite (二)TensorFlow Lite Hello World_flowlite_esp32 tflite-程序员宅基地

文章浏览阅读3.8k次,点赞5次,收藏47次。这篇文章将介绍使用 TensorFlow Lite for Microcontrollers 的基础知识。它包括训练模型,将其转换为 TensorFlow Lite 版本使用以及在微控制器上运行的完整的端到端工作流程。_flowlite_esp32 tflite

STC8H8K64U 的 USB 功能测试(未成功)_stc打狗棒识别不到usb-程序员宅基地

文章浏览阅读1.1k次,点赞2次,收藏3次。对 STC8H8K64U 的 USB 功能测试, 因为存在很多问题并且未能解释/解决, 就不写到系列里了, 把记录放上来抛砖引玉吧. 也许是使用的方法不对, 这些记录对其他人也许会有帮助. 待有更多资料再试_stc打狗棒识别不到usb

Linux SSH详细更改端口号教程_shh配置文件内端口号修改-程序员宅基地

文章浏览阅读1.3k次。SSH一到手,第一件事情就是更改默认的端口号,避免被黑客很容易的就找到端口号做成肉鸡。更改端口号是通过修改SSH的配置文件实现的,登录ssh后,输入1 vim /etc/ssh/sshd_config 注:vim编辑器详细使用方法http://wiki.ubuntu.org.cn/Vim向下找到#Port 22这段输入1 i 进入vim插入模式,进行编辑..._shh配置文件内端口号修改

php 笔记_str_replace(php_eol,"",$update);-程序员宅基地

文章浏览阅读208次。得到二维数据中指定列值array_column数组去重array_unique序列化存储serializedb[′data′]=serialize(db[&amp;amp;#x27;data&amp;amp;#x27;]=serialize(db[′data′]=serialize(data);//序列化存储data=unserialize(data=unserialize(data=unseria......_str_replace(php_eol,"",$update);