首页 > 解决方案 > Python:如何正确地将句子分成两个句子?

问题描述

我在 big_sentence 变量中有一个字符串。

big_sentence = "1.Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut laboure et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor在 voluptate velit esse cillum dolore eu fugiat nulla pariatur 受到谴责, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. 例外sint occaecat cupidatat non proident,罪魁祸首 mollit anim id est labourum。”

我想有这样的分裂:

var_1 = "1.Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor在 voluptate velit esse cillum dolore eu fugiat nulla pariatur 受到谴责。Exceptioneur sint occaecat cupidatat non proident,sunt in culpa qui officia deserunt mollit anim id est laborum。

var_2 = "2.Lorem ipsum .. dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua。Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea "

我试图这样做:

big_string.split('.')

但是 big_sentence 中的问题是我有“1”。“2。” 并且在“2.Lorem ipsum”之后还有几个句点“.....”

我该怎么做才能实现我的目标?

标签: python

解决方案


您可以尝试使用正则表达式。类似的东西。

import re

re.split("\d\.", big_sentence). # \d means a digit and \. means a dot

['',
'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.',
'Lorem ipsum ....... dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum.']

推荐阅读