首页 > 解决方案 > 阅读文件并找出一组独特的单词

问题描述

我是python/或一般编程世界的新手。我有一个包含两个 .txt 文件的文件夹。我想读取文件并创建一个数据结构来存储这些文件中的所有唯一单词。这是我写的,

import glob
import errno
path = '/path/to/my/files/*.txt'
files = glob.glob(path)

for name in files:
    try:
        with open(name, encoding="ISO-8859-1") as f:
            f.read()
    except IOError as exc:
        if exc.errno != errno.EISDIR:
            raise

但我不知道如何修改程序以找到唯一的单词。如果您能指导我,我将不胜感激。谢谢你。

标签: pythonpython-3.x

解决方案


你可以这样做:

import glob
import errno
path = '/path/to/my/files/*.txt'
files = glob.glob(path)

unique = dict()

for name in files:
   try:
       with open(name, encoding="ISO-8859-1") as f:
           data = f.read()
           for word in data.split(' '):
               if word.strip():
                   unique[word] = word

    except IOError as exc:
        if exc.errno != errno.EISDIR:
            raise

print unique.keys()

推荐阅读