python-3.x - 如何从文本中获取信息并使用python将其保存在变量中
问题描述
所以我正在尝试制作一个离线词典,并作为单词的来源,我使用的是 .txt 文件。我有一些与此相关的问题。如何在我的文本文件中找到特定单词并将其保存在变量中?我的文件长度也很重要,它会影响速度吗?这只是我的 .txt 文件的一部分:
Abendhimmel m вечерно небе.|-| Abendkasse f Theat вечерна каса.|-| Abendkleid n вечерна рокля.|-| Abendland n o.Pl. geh Западът.|-|
我想要的是保存麦芽汁,例如,Abendkasse 和其他所有东西,直到这个符号 |-| 在一个变量中。谢谢你的帮助!
解决方案
我建议您查看名为 realines() 和 read() 的 python 标准库函数(在打开的文件上)。我不知道您的文件有多大,但您通常可以将整个内容读入 ram(使用 read 或 readlines),然后搜索您获得的字符串。Searchin 可以用正则表达式或简单的循环来完成。
文件的长度很重要,因为打开较大的文件需要稍长的时间。尽管通常这仍然很快,即使对于大型文本文件也是如此。事实上,我认为在很多情况下,首先读取整个文件会更快,因为一旦将其读入 ram,对其进行的所有操作都会更快。
一个例子:
with open("yourlargetextfile.txt", f):
contents = f.readlines()
for line in contents:
# split every line into parts from |-| to the next |-|
parts = line.split("|-|")
推荐阅读
- javascript - 如何将网页中的字符串输入作为 Java 对象传递给 @RestController?
- performance - 与后续执行相比,Drools 初始调用速度较慢
- python-3.x - 如何在烧瓶应用程序中初始化多处理类
- oracle11g - 合并两个 sys_refcursor 的输出
- ios - 刷新时锁定滚动视图?
- git - 将 .git 上移多个级别
- java - DynamoDB - 如何检查现有表是空的还是非空的
- python - 在python中确保字典作为另一个类的构造函数中的参数传递的最佳方法/实践是什么,不会发生突变?
- python - Upsert 到 pyq 中的表
- python - 如何在图像中找到矩形轮廓?