python - txt 文件的字数统计并输出到文件
问题描述
我想计算在文本文件中找到每个单词的次数,但不确定出了什么问题。我也很难找到一种方法来将单词不大写的出现包括在计数中
- 该脚本需要两个命令行参数:输入文件的名称和阈值(整数)
输入文件每行只包含一个单词,单词前后没有空格。该脚本不需要验证输入文件的内容。
输入文件中单词的字母大小写与计数无关。例如,脚本应将“the”、“The”和“THE”视为同一个词。
在计算单词后,脚本会打印一份报告(到文件 output.txt),其中列出了单词及其计数。仅当每个单词的计数大于或等于命令行上给定的阈值时,才会打印每个单词。
这是我的代码:
file = open(r"E:\number.txt", "r", encoding="utf-8-sig")
from collections import Counter
word_counter = Counter(file.read().split())
for item in word_counter.items():
print("{}\t{}".format(*item))
file.close()
但我希望以下列方式输出:
解决方案
或与熊猫
import pandas as pd #Import Pandas
text1= pd.read_csv("E:\number.txt", header=None) #Read text file
s=pd.Series(text1[0]).str.lower() #convert to lowercase series
frequency_list = s.value_counts() #get frequencies of unique values
推荐阅读
- css - div 文本内容中的 css 数学运算符得到特殊处理
- ruby-on-rails - 标签为::simple_form 中的布尔值
- c++ - 为什么我们再次从结构对象创建结构变量?
- reactjs - 尝试在按钮内渲染 svg 图像时为什么会崩溃
- sql - 在红移中计算一年中的周数作为excel中的weeknum()
- sql - 如何计算一个值的运行总计,该值取决于 Oracle SQL 中的运行总计本身
- python - cur = mysql.connector.cursor() AttributeError: 'MySQL' object has no attribute 'connector'
- python - 找到覆盖给定集合的最小子集集
- arrays - 如何访问 D3js 中的嵌套数据
- hpc - 我想在单台计算机上的 ubuntu 上安装和运行 slurm