首页 > 解决方案 > 使用 sys.argv[1] 为字数统计程序导入文件

问题描述

我创建了一个 wordcount 程序,其中一个函数用于标记单词,一个用于计算单词,一个用于打印最常用的单词。

现在我需要将它导入到一个测试中,它会检查一切是否正确。

程序应该被执行(数字是有多少最常用的词):

topmost.py eng_stopwords.txt examples/arcticle1.text 20

我需要为这两个文件创建一个路径,以及要打印的数字的最后一个参数。我所有的函数 tokenize、countWords 和 printTopMost 都需要在一个主函数中。

在停用词文件中,我还需要删除一个特殊字符(表示行尾)

这是我到目前为止所做的。

import wordfreq
import sys

inp_file = open(sys.argv[1])
for line in inp_file.readlines()
for line in inp_file(stopWords) = line.strip()
# Get tokenize function?
inp_file.close()
inp_stopWords.close()

这里可能有很多错误的输入。但是,如果有人可以帮助我,我将不胜感激!

标签: pythoncountsys

解决方案


推荐阅读