如何更正 pandas 数据框中的拼写错误
How to correct typos in pandas dataframe
我有一个这样的 pandas 数据框
a b c
1 "hi" 1 2
2 "hi" 4 1
3 "Hi" 1 3
4 "hi" 2 1
5 "Hi" 2 1
所有"Hi"应该更正为"hi",我怎么能在pandas
之前干净利落地
这是一个玩具示例,真实数据可以更大
使用replace
:
In [127]: df.loc[:, "a"] = df.a.replace("Hi", "hi")
In [128]: df
Out[128]:
a b c
1 hi 1 2
2 hi 4 1
3 hi 1 3
4 hi 2 1
5 hi 2 1
您可以将 lambda 函数应用于数据框中 returns 包含的字符串的小写字母的列 a
,如果您的更正只是将字符串变成小写字母。
例如
df.a = df.a.apply(lambda x: x.lower())
apply function
方法可以扩展用于其他更具体的替换。
例如
df.a = df.a.apply(lambda x: 'hi' if x == 'Hi' else x)
或者您可以使用函数代替 lambda 进行更复杂的转换。
def my_replacement_func(x):
return x.lower()
df.a = df.a.apply(my_replacement_func)
如果你想让它小写,你可以这样做-
df['a'] = df['a'].str.lower()
如果你想替换某些词-
df['a'] = df['a'].str.replace('Hi', 'hi')
或者如果单词出现在短语中,请使用正则表达式 -
df['a'] = df['a'].str.replace('\bHi\b', 'hi')
这个正则表达式选项让您甚至可以使用单词 -
In [12]: df
Out[12]:
a b
0 hi 1
1 hi 2
2 Hi mom 3
3 mom Hi, mom 4
4 mHim Hi 5
In [13]: df['a'] = df.a.str.replace(r'\bHi\b', 'hi')
In [14]: df
Out[14]:
a b
0 hi 1
1 hi 2
2 hi mom 3
3 mom hi, mom 4
4 mHim hi 5
请注意,所有单词 'Hi' 都被替换为 'hi',但在最后一个示例中,'Hi' 出现在单词中间,替换没有完成。
我有一个这样的 pandas 数据框
a b c
1 "hi" 1 2
2 "hi" 4 1
3 "Hi" 1 3
4 "hi" 2 1
5 "Hi" 2 1
所有"Hi"应该更正为"hi",我怎么能在pandas
之前干净利落地这是一个玩具示例,真实数据可以更大
使用replace
:
In [127]: df.loc[:, "a"] = df.a.replace("Hi", "hi")
In [128]: df
Out[128]:
a b c
1 hi 1 2
2 hi 4 1
3 hi 1 3
4 hi 2 1
5 hi 2 1
您可以将 lambda 函数应用于数据框中 returns 包含的字符串的小写字母的列 a
,如果您的更正只是将字符串变成小写字母。
例如
df.a = df.a.apply(lambda x: x.lower())
apply function
方法可以扩展用于其他更具体的替换。
例如
df.a = df.a.apply(lambda x: 'hi' if x == 'Hi' else x)
或者您可以使用函数代替 lambda 进行更复杂的转换。
def my_replacement_func(x):
return x.lower()
df.a = df.a.apply(my_replacement_func)
如果你想让它小写,你可以这样做-
df['a'] = df['a'].str.lower()
如果你想替换某些词-
df['a'] = df['a'].str.replace('Hi', 'hi')
或者如果单词出现在短语中,请使用正则表达式 -
df['a'] = df['a'].str.replace('\bHi\b', 'hi')
这个正则表达式选项让您甚至可以使用单词 -
In [12]: df
Out[12]:
a b
0 hi 1
1 hi 2
2 Hi mom 3
3 mom Hi, mom 4
4 mHim Hi 5
In [13]: df['a'] = df.a.str.replace(r'\bHi\b', 'hi')
In [14]: df
Out[14]:
a b
0 hi 1
1 hi 2
2 hi mom 3
3 mom hi, mom 4
4 mHim hi 5
请注意,所有单词 'Hi' 都被替换为 'hi',但在最后一个示例中,'Hi' 出现在单词中间,替换没有完成。