在 Quanteda 中标记文本并使用字典进行分析

Tokenize Text and Analyze with Dictionary in Quanteda

我正在尝试使用 R 中的 quanteda 包进行文本分析,并且在不对我的文本进行任何操作的情况下成功获得了所需的输出。但是,我有兴趣删除停用词和其他常用短语以重新运行分析(根据我在其他来源中学习的内容——这个过程称为 "Tokenizing"(?))。 (说明来自https://data.library.virginia.edu/a-beginners-guide-to-text-analysis-with-quanteda/

我可以使用说明和 quanteda 包处理文本。但是,我有兴趣应用字典来分析文本。我怎样才能做到这一点?由于很难在此处附上我的所有文档,因此我可以应用的任何提示或示例都会有所帮助并非常感谢。

谢谢!

我已经使用这个库取得了巨大的成功,然后按单词合并以获得分数或情绪。按单词合并

library(tidytext)

get_sentiments("afinn")
get_sentiments("bing")

您可以将其另存为 table

table <- get_sentiments("afinn")

total <- merge(data frameA,data frameB,by="ID")