python - 阅读文件并找出一组独特的单词
问题描述
我是python/或一般编程世界的新手。我有一个包含两个 .txt 文件的文件夹。我想读取文件并创建一个数据结构来存储这些文件中的所有唯一单词。这是我写的,
import glob
import errno
path = '/path/to/my/files/*.txt'
files = glob.glob(path)
for name in files:
try:
with open(name, encoding="ISO-8859-1") as f:
f.read()
except IOError as exc:
if exc.errno != errno.EISDIR:
raise
但我不知道如何修改程序以找到唯一的单词。如果您能指导我,我将不胜感激。谢谢你。
解决方案
你可以这样做:
import glob
import errno
path = '/path/to/my/files/*.txt'
files = glob.glob(path)
unique = dict()
for name in files:
try:
with open(name, encoding="ISO-8859-1") as f:
data = f.read()
for word in data.split(' '):
if word.strip():
unique[word] = word
except IOError as exc:
if exc.errno != errno.EISDIR:
raise
print unique.keys()
推荐阅读
- android - 从图库中选择图像/视频后如何获取媒体类型或 MIME 类型?
- statistics - 最佳线性回归模型的相关性与某种相关性的变量数量作为输入
- windows - 用于在文件夹中读取的 cmd 文件并将特定文件名保存为字符串
- ibm-datapower - Datapower 脚本 - 解析 JSON
- sql-server - EF 找不到生产数据库
- synchronization - RClone (OneNote) 的 OneDrive 同步问题
- load-balancing - HAProxy 中的自定义负载均衡逻辑
- javascript - Next / React JS 无限渲染组件 onClick
- pytorch - 使用 PyTorch 进行数据集量化
- angular - 如何自动设置 mat-option 元素宽度以适应选项值