如何应用正则表达式替换值
How to applying regex to replace values
我有一个这样的数据框省份:
province = {'province':['Prov. Jawa Barat', 'JAWA BARAT', 'Prop. Jawa Barat', 'Prov. Sumarta Selatan', 'SUMARTA SELATAN', 'Prop. Sumatra Selatan'],
'city':['Bandung', 'Bogor', 'Cimahi', 'Palembang', 'Solo', 'Cilacap']}
df_prov = pd.DataFrame(province)
但是,各省的名称并没有相同的规则。那么如何将前缀为'Prov'和'Prop'的省名改为JAWA BARAT和SUMARTA SELATAN呢?
抱歉我英语说得不太好
谢谢
您可以尝试简单地删除前缀并将剩余的大写:
df_prov["province"] = df_prov["province"].str.replace(r'^Pro[pv]\. ', '').str.upper()
我有一个这样的数据框省份:
province = {'province':['Prov. Jawa Barat', 'JAWA BARAT', 'Prop. Jawa Barat', 'Prov. Sumarta Selatan', 'SUMARTA SELATAN', 'Prop. Sumatra Selatan'],
'city':['Bandung', 'Bogor', 'Cimahi', 'Palembang', 'Solo', 'Cilacap']}
df_prov = pd.DataFrame(province)
但是,各省的名称并没有相同的规则。那么如何将前缀为'Prov'和'Prop'的省名改为JAWA BARAT和SUMARTA SELATAN呢?
抱歉我英语说得不太好 谢谢
您可以尝试简单地删除前缀并将剩余的大写:
df_prov["province"] = df_prov["province"].str.replace(r'^Pro[pv]\. ', '').str.upper()