在 Quanteda 中标记文本并使用字典进行分析
Tokenize Text and Analyze with Dictionary in Quanteda
我正在尝试使用 R 中的 quanteda
包进行文本分析,并且在不对我的文本进行任何操作的情况下成功获得了所需的输出。但是,我有兴趣删除停用词和其他常用短语以重新运行分析(根据我在其他来源中学习的内容——这个过程称为 "Tokenizing"(?))。 (说明来自https://data.library.virginia.edu/a-beginners-guide-to-text-analysis-with-quanteda/)
我可以使用说明和 quanteda
包处理文本。但是,我有兴趣应用字典来分析文本。我怎样才能做到这一点?由于很难在此处附上我的所有文档,因此我可以应用的任何提示或示例都会有所帮助并非常感谢。
谢谢!
我已经使用这个库取得了巨大的成功,然后按单词合并以获得分数或情绪。按单词合并
library(tidytext)
get_sentiments("afinn")
get_sentiments("bing")
您可以将其另存为 table
table <- get_sentiments("afinn")
total <- merge(data frameA,data frameB,by="ID")
我正在尝试使用 R 中的 quanteda
包进行文本分析,并且在不对我的文本进行任何操作的情况下成功获得了所需的输出。但是,我有兴趣删除停用词和其他常用短语以重新运行分析(根据我在其他来源中学习的内容——这个过程称为 "Tokenizing"(?))。 (说明来自https://data.library.virginia.edu/a-beginners-guide-to-text-analysis-with-quanteda/)
我可以使用说明和 quanteda
包处理文本。但是,我有兴趣应用字典来分析文本。我怎样才能做到这一点?由于很难在此处附上我的所有文档,因此我可以应用的任何提示或示例都会有所帮助并非常感谢。
谢谢!
我已经使用这个库取得了巨大的成功,然后按单词合并以获得分数或情绪。按单词合并
library(tidytext)
get_sentiments("afinn")
get_sentiments("bing")
您可以将其另存为 table
table <- get_sentiments("afinn")
total <- merge(data frameA,data frameB,by="ID")