在 Quanteda 中标记文本并使用字典进行分析

Question

我正在尝试使用 R 中的 quanteda 包进行文本分析，并且在不对我的文本进行任何操作的情况下成功获得了所需的输出。但是，我有兴趣删除停用词和其他常用短语以重新运行分析（根据我在其他来源中学习的内容——这个过程称为 "Tokenizing"(?)）。（说明来自https://data.library.virginia.edu/a-beginners-guide-to-text-analysis-with-quanteda/）

我可以使用说明和 quanteda 包处理文本。但是，我有兴趣应用字典来分析文本。我怎样才能做到这一点？由于很难在此处附上我的所有文档，因此我可以应用的任何提示或示例都会有所帮助并非常感谢。

谢谢！

Answer 1

我已经使用这个库取得了巨大的成功，然后按单词合并以获得分数或情绪。按单词合并

library(tidytext)

get_sentiments("afinn")
get_sentiments("bing")

您可以将其另存为 table

table <- get_sentiments("afinn")

total <- merge(data frameA,data frameB,by="ID")

在 Quanteda 中标记文本并使用字典进行分析

Tokenize Text and Analyze with Dictionary in Quanteda

r

quanteda