如何应用正则表达式替换值

How to applying regex to replace values

我有一个这样的数据框省份:

province = {'province':['Prov. Jawa Barat', 'JAWA BARAT', 'Prop. Jawa Barat', 'Prov. Sumarta Selatan', 'SUMARTA SELATAN', 'Prop. Sumatra Selatan'],
            'city':['Bandung', 'Bogor', 'Cimahi', 'Palembang', 'Solo', 'Cilacap']}

df_prov = pd.DataFrame(province)

但是,各省的名称并没有相同的规则。那么如何将前缀为'Prov'和'Prop'的省名改为JAWA BARAT和SUMARTA SELATAN呢?

抱歉我英语说得不太好 谢谢

您可以尝试简单地删除前缀并将剩余的大写:

df_prov["province"] = df_prov["province"].str.replace(r'^Pro[pv]\. ', '').str.upper()