使用 R 过滤注释以进行文本挖掘
Using R to filter comments for text mining
我正在使用 R 并且对编程比较陌生,因此我们将不胜感激。
我正在为一项调查进行文本挖掘,想用词的组合来过滤评论。数据集已从 csv 文件中读取。
我想过滤包含 "abroad" 和 "charges"
的评论
我正在使用 grepl 函数来识别注释中的模式。
我设法过滤了评论部分中的数据,其中包含以下文字
"abroad" 和 "charges" 通过使用以下代码:
ac <- filter(data, grepl("abroad|charges", Comment))
ac$Comment
此 returns 评论包含 "abroad" 和 "charges",但 returns 评论可以包含 "abroad" 或 "charges" .我想要这两个词的组合。我尝试更换 |与 & 但这不起作用。
我也试过子集:
ac <- subset(data, Comment %in% c("abroad", "charges"))
ac$Comment
None 其中 return 是期望的结果。我错过了一些明显的东西吗?如何查看其中仅包含某些单词的评论。因此,如果我想进一步探索我的文本,我可以尝试找到 "abroad" 和 "charges" 以及 "expensive."
的组合
谢谢,任何帮助都会很棒。
我们可以在 filter
中使用双 grep
和 &
运算符,对于同时包含 'abroad' 和'charges' 在 string
.
filter(data, grepl("abroad", Comment) & grepl('charges', Comment))
我正在使用 R 并且对编程比较陌生,因此我们将不胜感激。
我正在为一项调查进行文本挖掘,想用词的组合来过滤评论。数据集已从 csv 文件中读取。
我想过滤包含 "abroad" 和 "charges"
的评论我正在使用 grepl 函数来识别注释中的模式。 我设法过滤了评论部分中的数据,其中包含以下文字 "abroad" 和 "charges" 通过使用以下代码:
ac <- filter(data, grepl("abroad|charges", Comment))
ac$Comment
此 returns 评论包含 "abroad" 和 "charges",但 returns 评论可以包含 "abroad" 或 "charges" .我想要这两个词的组合。我尝试更换 |与 & 但这不起作用。
我也试过子集:
ac <- subset(data, Comment %in% c("abroad", "charges"))
ac$Comment
None 其中 return 是期望的结果。我错过了一些明显的东西吗?如何查看其中仅包含某些单词的评论。因此,如果我想进一步探索我的文本,我可以尝试找到 "abroad" 和 "charges" 以及 "expensive."
的组合谢谢,任何帮助都会很棒。
我们可以在 filter
中使用双 grep
和 &
运算符,对于同时包含 'abroad' 和'charges' 在 string
.
filter(data, grepl("abroad", Comment) & grepl('charges', Comment))