我需要一个正则表达式来搜索标题

I need a Regex Expression for searching title

在数据集中,我需要找出“先生”、“夫人”的实例数量。和“小姐”。有。例如:

Obama, Mr. Barack Hussein
Obama, Mrs. Michelle LaVaughn Robinson
Biden, Mr. Joe
Portman, Miss. Natalie

在此表达式中,它必须在“,”之后搜索并且必须得到“Mr.”。确切地。在我的搜索代码中,它也计算“mrs”而不是“Mr.”。

Mr = df.loc[df['Name'].str.contains('Mr.', case=False)]

您可以使用正则表达式。标题足够独特,不应出现在其他任何地方。

df['Name'].str.extract('(Mr\.|Mrs\.|Miss\.)').value_counts()

输出:

Mr.      2
Miss.    1
Mrs.     1