首页 > 解决方案 > 如何从文本中获取信息并使用python将其保存在变量中

问题描述

所以我正在尝试制作一个离线词典,并作为单词的来源,我使用的是 .txt 文件。我有一些与此相关的问题。如何在我的文本文件中找到特定单词并将其保存在变量中?我的文件长度也很重要,它会影响速度吗?这只是我的 .txt 文件的一部分:

Abendhimmel m вечерно небе.|-| Abendkasse f Theat вечерна каса.|-| Abendkleid n вечерна рокля.|-| Abendland n o.Pl. geh Западът.|-|

我想要的是保存麦芽汁,例如,Abendkasse 和其他所有东西,直到这个符号 |-| 在一个变量中。谢谢你的帮助!

标签: python-3.xtexttext-processing

解决方案


我建议您查看名为 realines() 和 read() 的 python 标准库函数(在打开的文件上)。我不知道您的文件有多大,但您通常可以将整个内容读入 ram(使用 read 或 readlines),然后搜索您获得的字符串。Searchin 可以用正则表达式或简单的循环来完成。

文件的长度很重要,因为打开较大的文件需要稍长的时间。尽管通常这仍然很快,即使对于大型文本文件也是如此。事实上,我认为在很多情况下,首先读取整个文件会更快,因为一旦将其读入 ram,对其进行的所有操作都会更快。

一个例子:


with open("yourlargetextfile.txt", f):
    contents = f.readlines()
    for line in contents:
        # split every line into parts from |-| to the next |-|
        parts = line.split("|-|")


推荐阅读