替换scala中的特殊字符
Replacing special characters in scala
我正在使用 scala,想从我的数据框中替换特殊字符 replaceAll
似乎不起作用,还有其他方法吗?
我的代码是这样的:
val specialchar = dataframe.select(column).replaceAll("[^A-za-z]+","")
您可以在正则表达式中提供允许的字符。
尝试关注
val badDF = Seq(("7369", "SMI_)(TH" , "2010-12-17", "800.00"), ("7499", "AL@;__#$LEN","2011-02-20", "1600.00")).toDF("empno", "ename","hire_date", "sal")
val cleanedDF = badDF.select(badDF.columns.map(c => regexp_replace(badDF(c), """[^A-Z a-z 0-9]""", "").alias(c)): _*)
cleanedDF.show
ename 包含特殊字符。以上正则表达式将只允许 Capital/Small a-z characters
和 0-9 digits
。所有其他字符都将被删除。
我正在使用 scala,想从我的数据框中替换特殊字符 replaceAll
似乎不起作用,还有其他方法吗?
我的代码是这样的:
val specialchar = dataframe.select(column).replaceAll("[^A-za-z]+","")
您可以在正则表达式中提供允许的字符。
尝试关注
val badDF = Seq(("7369", "SMI_)(TH" , "2010-12-17", "800.00"), ("7499", "AL@;__#$LEN","2011-02-20", "1600.00")).toDF("empno", "ename","hire_date", "sal")
val cleanedDF = badDF.select(badDF.columns.map(c => regexp_replace(badDF(c), """[^A-Z a-z 0-9]""", "").alias(c)): _*)
cleanedDF.show
ename 包含特殊字符。以上正则表达式将只允许 Capital/Small a-z characters
和 0-9 digits
。所有其他字符都将被删除。