Pandas> 删除以反斜杠结尾的字符串并保留反斜杠后的字符串?
Pandas> Remove strings ending with backslash and remain strings after backslash?
我怎样才能去掉最后一个反斜杠(包括反斜杠)之前的每个字母,我只想保留其余部分。但是不知道怎么打码,
*原始数据框(来自xlsx文件)
BS1\CB\A2C40001444 42.3
BS1\CB\A2C40006231 32.1
BS1\A2C01345300 44.45
BS1\A2C01345300 44.45
BS1\CB\A2C0134530044.4
*需要数据框
A2C40001444 42.3
A2C40006231 32.1
A2C01345300 44.45
A2C01345300 44.45
A2C01345300 44.4
reg expr 提取物为您完成
- 获取最后一个反斜杠之前的所有文本
- 最后一个反斜杠后的所有内容都进入匹配组
df = pd.read_csv(io.StringIO("""text val
BS1\CB\A2C40001444 42.3
BS1\CB\A2C40006231 32.1
BS1\A2C01345300 44.45
BS1\A2C01345300 44.45
BS1\CB\A2C01345300 44.4"""), sep="\s+")
df["text"] = df["text"].str.extract("^[\w\\]*\\(.*)")
print(df.to_string(index=False))
输出
text val
A2C40001444 42.30
A2C40006231 32.10
A2C01345300 44.45
A2C01345300 44.45
A2C01345300 44.40
我怎样才能去掉最后一个反斜杠(包括反斜杠)之前的每个字母,我只想保留其余部分。但是不知道怎么打码,
*原始数据框(来自xlsx文件) BS1\CB\A2C40001444 42.3 BS1\CB\A2C40006231 32.1 BS1\A2C01345300 44.45 BS1\A2C01345300 44.45 BS1\CB\A2C0134530044.4
*需要数据框 A2C40001444 42.3 A2C40006231 32.1 A2C01345300 44.45 A2C01345300 44.45 A2C01345300 44.4
reg expr 提取物为您完成
- 获取最后一个反斜杠之前的所有文本
- 最后一个反斜杠后的所有内容都进入匹配组
df = pd.read_csv(io.StringIO("""text val
BS1\CB\A2C40001444 42.3
BS1\CB\A2C40006231 32.1
BS1\A2C01345300 44.45
BS1\A2C01345300 44.45
BS1\CB\A2C01345300 44.4"""), sep="\s+")
df["text"] = df["text"].str.extract("^[\w\\]*\\(.*)")
print(df.to_string(index=False))
输出
text val
A2C40001444 42.30
A2C40006231 32.10
A2C01345300 44.45
A2C01345300 44.45
A2C01345300 44.40