python - 在每个时期而不是按行拆分 .txt?
问题描述
我正在尝试将 .txt 文件逐句拆分为列表,但我的编码工作只能按行拆分。
.txt 内容示例:
This is line 1 of txt file,
it is now on line 2. Here is the
second sentence between line 2 and 3.
代码
listed = []
with open("example.txt","r") as text:
Line = text.readline()
while Line!="":
Line1 = Line.split(".")
for sentence in Line1:
listed.append(sentence)
Line = text.readline()
print(listed)
这将打印如下内容:['This is line 1 of txt file,\n','it is now on line 2\n', 'Here is the\n','second sentence between line 2 and 3/n']
如果整个文档在一行上,这将正常工作,除了“先生”之类的情况。和“夫人” 等等。然而,这是未来的担忧。有谁知道如何在上述情况下使用拆分?
解决方案
字符串上的拆分将根据您的要求拆分,而不考虑换行符,只需读取即可拉出整个文件而不是读取行。问题在于单次阅读是否需要处理太多文本,如果是这样,您将需要更加聪明。您可能希望过滤掉实际的换行符以获得每句一串的效果。
推荐阅读
- codeigniter - 如何在 Codeigniter 1 中更改管理员登录 url?
- javascript - 使用 OpenLayers 和 CSS 网格布局时如何正确设置对齐方式
- sql - 在 SQL 中正确显示下一个计费周期开始日期 - [应根据报表运行日期显示未来计费日期]
- rust - 嵌套循环打印奇怪的结果
- java - Android - 在单独的线程中从 for 循环更新进度条
- r - 如何合并数据库,将一个值重复到另一个值中?
- android - 带有标题的 Recylerview 显示数据但负 1
- javascript - 在 for 循环中附加子文本的最佳实践
- c++ - SQL Server 连接 C++
- android - 如何读取安装在 android 7 版本上的 .pkcs12 证书