首页 > 解决方案 > 计算文本文件中每个句子的单词和每个段落的句子

问题描述

我无法正常化字典。在我的字典中,我有一堆我们打算在文本文件中计数的单词。现在对于这些单词/字符中的每一个,在我的项目的上下文中,“规范化”是将它们的频率/值除以给定文本中的句子总数。然后我必须用这些新值替换字典的旧值。

即我的字典的名称是计数,键和值如下:

{'and': 5, ';' : 3, '-' : 0...} 
def main(textfile, normalize == True):
    .
    .
    .
    .
    if normalize == True:
        for x in count:
            new_count[x] = count[x]/numSentence
            print(x,count[x])

这是一个示例文件,用于尝试任何代码:https ://www.dropbox.com/s/7xph5pb9bdf551h/sample2.txt?dl=0 另请注意,在上面的代码中, normalize == True 存在,因为在顶层功能

标签: pythonpython-3.x

解决方案


推荐阅读