使用 R 过滤注释以进行文本挖掘

Using R to filter comments for text mining

我正在使用 R 并且对编程比较陌生,因此我们将不胜感激。

我正在为一项调查进行文本挖掘,想用词的组合来过滤评论。数据集已从 csv 文件中读取。

我想过滤包含 "abroad" 和 "charges"

的评论

我正在使用 grepl 函数来识别注释中的模式。 我设法过滤了评论部分中的数据,其中包含以下文字 "abroad" 和 "charges" 通过使用以下代码:

ac <- filter(data, grepl("abroad|charges", Comment))

  ac$Comment

此 returns 评论包含 "abroad" 和 "charges",但 returns 评论可以包含 "abroad" 或 "charges" .我想要这两个词的组合。我尝试更换 |与 & 但这不起作用。

我也试过子集:

ac <- subset(data, Comment %in% c("abroad", "charges"))

ac$Comment

None 其中 return 是期望的结果。我错过了一些明显的东西吗?如何查看其中仅包含某些单词的评论。因此,如果我想进一步探索我的文本,我可以尝试找到 "abroad" 和 "charges" 以及 "expensive."

的组合

谢谢,任何帮助都会很棒。

我们可以在 filter 中使用双 grep& 运算符,对于同时包含 'abroad' 和'charges' 在 string.

 filter(data, grepl("abroad", Comment) & grepl('charges', Comment))