无法使用 gsub 从字符串中删除 unicode 字符
Can't remove unicode characters from strings using gsub
我查看了许多其他关于如何从字符串中删除 unicode 字符的 Whosebug questions/answers,但其中 none 似乎对我有用!
精确问题重现:
event = as.data.frame(read_html("https://www.bestfightodds.com/events/ufc-226-miocic-vs-cormier-1447") %>% html_table(fill=T))
event$X5Dimes
如您所见,嵌入了向上和向下箭头。我想删除它们,以便仅保留该行。例如
"-310<U+25BC>" would become "-310"
我已经尝试了很多 gsub 模式来删除它们——我自己创建的以及来自其他堆栈溢出答案的——但没有任何效果!下面是一些示例模式
event$X5Dimes = gsub("<.+>", "", event$X5Dimes)
event$X5Dimes = gsub("\S+\s+|-", "", event$X5Dimes)
event$X5Dimes = gsub("^\s*<U\+\w+>\s*", "", event$X5Dimes)
event$X5Dimes = gsub("\<U[^\>]*\>", "", event$X5Dimes)
有人能帮忙吗?非常感谢 - 失去理智!谢谢!
尝试简单地这样做:
event$X5Dimes = gsub("▼|▲", "", event$X5Dimes)
我查看了许多其他关于如何从字符串中删除 unicode 字符的 Whosebug questions/answers,但其中 none 似乎对我有用!
精确问题重现:
event = as.data.frame(read_html("https://www.bestfightodds.com/events/ufc-226-miocic-vs-cormier-1447") %>% html_table(fill=T))
event$X5Dimes
如您所见,嵌入了向上和向下箭头。我想删除它们,以便仅保留该行。例如
"-310<U+25BC>" would become "-310"
我已经尝试了很多 gsub 模式来删除它们——我自己创建的以及来自其他堆栈溢出答案的——但没有任何效果!下面是一些示例模式
event$X5Dimes = gsub("<.+>", "", event$X5Dimes)
event$X5Dimes = gsub("\S+\s+|-", "", event$X5Dimes)
event$X5Dimes = gsub("^\s*<U\+\w+>\s*", "", event$X5Dimes)
event$X5Dimes = gsub("\<U[^\>]*\>", "", event$X5Dimes)
有人能帮忙吗?非常感谢 - 失去理智!谢谢!
尝试简单地这样做:
event$X5Dimes = gsub("▼|▲", "", event$X5Dimes)