當前位置:編程學習大全網 - 電腦編程 - 如何用python和jieba分詞,統計詞頻?

如何用python和jieba分詞,統計詞頻?

#!?python3

#?-*-?coding:?utf-8?-*-

import?os,?codecs

import?jieba

from?collections?import?Counter

def?get_words(txt):

seg_list?=?jieba.cut(txt)

c?=?Counter()

for?x?in?seg_list:

if?len(x)>1?and?x?!=?'\r\n':

c[x]?+=?1

print('常用詞頻度統計結果')

for?(k,v)?in?c.most_common(100):

print('%s%s?%s?%d'?%?('?'*(5-len(k)),?k,?'*'*int(v/3),?v))

if?__name__?==?'__main__':

with?codecs.open('19d.txt',?'r',?'utf8')?as?f:

txt?=?f.read()

get_words(txt)

  • 上一篇:男生學遊戲開發吃香嗎?
  • 下一篇:macmini2011os10.14能不能用
  • copyright 2024編程學習大全網