把下面这段文字存入 t.txt 文件,格式为utf-8
我院2020年三二分段转段考核已经结束,根据《广东机电职业技术学院2020年职业院校中高职衔接三二分段招生章程》和《广东机电职业技术学院2018年中高职贯通培养三二分段试点考核工作方案》(2020年5月修订)等文件精神,拟录取986人,现将拟录取名单进行公示。
如对公示考生有异议,请以传真或电子邮件的形式向我院招生办反映,反映情况者须提供本人身份证正反面扫描件和联系方式(手机号码),否则将不予受理。
分析文章的高频词语
# -*- coding: utf-8 -*-
from jieba import *
def fre(tcut):
dic={}
for w in tcut:
if w not in ',。《》()':
dic[w]=dic.get(w,0)+1
return dic
def sortDict(dic):
sortList=list(dic.items())
sortList.sort(key=lambda x : x[1], reverse=True)
return sortList
with open('c:/1/t1.txt','r',encoding='utf-8') as tf:
text=tf.read()
list1=lcut(text)
dic=fre(list1)
result=sortDict(dic)
print('%-8s%3s'%('词语','次数'))
for i in range(10):
w,freq=result[i]
print(f'{w:<8}{freq:3}')
结果如下:
词语 次数
年 4
2020 3
三 3
二分 3
段 3
我院 2
考核 2
广东 2
机电 2
职业 2

