首页 > 解决方案 > 在每个时期而不是按行拆分 .txt?

问题描述

我正在尝试将 .txt 文件逐句拆分为列表,但我的编码工作只能按行拆分。

.txt 内容示例:

This is line 1 of txt file,
it is now on line 2. Here is the
second sentence between line 2 and 3.

代码

listed = []
with open("example.txt","r") as text:
    Line = text.readline()


while Line!="":
  Line1 = Line.split(".")
  for sentence in Line1:
    listed.append(sentence)
  Line = text.readline()


print(listed)

这将打印如下内容:['This is line 1 of txt file,\n','it is now on line 2\n', 'Here is the\n','second sentence between line 2 and 3/n']

如果整个文档在一行上,这将正常工作,除了“先生”之类的情况。和“夫人” 等等。然而,这是未来的担忧。有谁知道如何在上述情况下使用拆分?

标签: pythonlistsplit

解决方案


字符串上的拆分将根据您的要求拆分,而不考虑换行符,只需读取即可拉出整个文件而不是读取行。问题在于单次阅读是否需要处理太多文本,如果是这样,您将需要更加聪明。您可能希望过滤掉实际的换行符以获得每句一串的效果。


推荐阅读