Python: 动词保留撇号

Python: keep apostrophe with verbs

我想标记一个句子列表,但将否定动词保留为唯一词。

t = """As aren't good. Bs are good"""
print(word_tokenize(t))
['As', 'are', "n't", 'good', '.', 'Bs', 'are', 'good']

我想将 "aren't" 和 "are" 分开。使用 word_tokenize 我得到 "n't"。其他否定形式也一样,例如 (Couldn't, didn't, et)。

我该怎么做? 提前致谢

如果您想从 space 分隔的句子中提取单个单词,请使用 Python 的 split() 方法。

t = "As aren't good. Bs are good"
print (t.split())
['As', "aren't", 'good.', 'Bs', 'are', 'good']

您也可以在 split() 方法中指定其他分隔符。例如,如果你想根据句号来标记你的字符串,你可以这样做:

print (t.split("."))
["As aren't good", ' Bs are good']

阅读文档 here

使用 re 模块的拆分。https://docs.python.org/2/library/re.html

import re
t = "As aren't good. Bs are good"
list(filter(None,re.split(r"[\s+.]",t)))

输出:

['As', "aren't", 'good', 'Bs', 'are', 'good']