Splitlines 只得到两条分割线

Splitlines to get two splitted lines only

我有一段很长的文字,我想将其分成段落列表。我一直找不到工作包,所以我自己写了一个启发式。

首先,我想用两个换行符在所有地方拆分文本。使下面的文字:

"Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse tortor neque, tempor condimentum erat eget, faucibus tristique quam. Praesent hendrerit, mi non finibus iaculis, justo lacus pharetra purus, vitae bibendum lectus erat sit amet risus. Integer porta, risus id accumsan accumsan, lacus augue finibus orci, eu interdum sapien odio at enim. Vestibulum eget libero nisl. Donec accumsan justo a sem semper vehicular. 

Etiam convallis sodales felis quis iaculis. Aenean eget rhoncus libero, non iaculis leo. Pellentesque dictum mauris libero, a feugiat elit mollis facilisis. Nulla facilisi. Aliquam dictum lorem vitae nisl suscipit faucibus. Suspendisse at rhoncus est, vitae sagittis metus. Etiam massa lacus, gravida ut elit sit amet, sagittis feugiat enim. Nullam dictum pretium mi ac rutrum. Fusce ornare sollicitudin augue, dignissim bibendum ante cursus non. 

Sed et urna ac nibh molestie venenatis non at eros. Suspendisse eget enim ornare turpis gravida finibus. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia curae; Quisque hendrerit eros eros, nec euismod erat maximus quis. Donec fringilla nibh id ligula porta lacinia. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Cras sit amet auctor augue. 
Aenean porttitor cursus tempor. Ut rutrum feugiat purus, ac tincidunt nisl pharetra in. Nunc nunc libero, placerat eu tempus et, sagittis volutpat libero. Maecenas sit amet arcu sed felis consectetur dapibus." 

会拆分成如下(只有一个换行符才算同一段):

["Lorem ipsum dolor sit amet, consectetur adipiscing elit. Suspendisse tortor neque, tempor condimentum erat eget, faucibus tristique quam. Praesent hendrerit, mi non finibus iaculis, justo lacus pharetra purus, vitae bibendum lectus erat sit amet risus. Integer porta, risus id accumsan accumsan, lacus augue finibus orci, eu interdum sapien odio at enim. Vestibulum eget libero nisl. Donec accumsan justo a sem semper vehicular.",
"Etiam convallis sodales felis quis iaculis. Aenean eget rhoncus libero, non iaculis leo. Pellentesque dictum mauris libero, a feugiat elit mollis facilisis. Nulla facilisi. Aliquam dictum lorem vitae nisl suscipit faucibus. Suspendisse at rhoncus est, vitae sagittis metus. Etiam massa lacus, gravida ut elit sit amet, sagittis feugiat enim. Nullam dictum pretium mi ac rutrum. Fusce ornare sollicitudin augue, dignissim bibendum ante cursus non.",
"Sed et urna ac nibh molestie venenatis non at eros. Suspendisse eget enim ornare turpis gravida finibus. Vestibulum ante ipsum primis in faucibus orci luctus et ultrices posuere cubilia curae; Quisque hendrerit eros eros, nec euismod erat maximus quis. Donec fringilla nibh id ligula porta lacinia. Orci varius natoque penatibus et magnis dis parturient montes, nascetur ridiculus mus. Cras sit amet auctor augue. 
    Aenean porttitor cursus tempor. Ut rutrum feugiat purus, ac tincidunt nisl pharetra in. Nunc nunc libero, placerat eu tempus et, sagittis volutpat libero. Maecenas sit amet arcu sed felis consectetur dapibus."]

我该怎么做? (也欢迎使用用于此任务的包)。

注意:我将您的文本保存在文本文件中 b.txt

enter code here

a = open("b.txt","r")
read_a = a.read()
a.close()
c =read_a.split("\n\n")
print(len(c))
print(c)

如果文本来自文件,您可以使用 pythons readlines() 开始。结果是直到 ASCII LR/CR 的文本行。 如果文本不是来自文件,您可以在字符串中搜索“\r\n”以查找 LF/CR.