CountVectorizer' 对象没有属性 'get_feature_names_out'

Question

为什么我总是收到这个错误？我尝试了不同版本的 anaconda 3，但没有成功。我应该安装什么才能正常工作？我使用 0.20 - 0.23 的 sklearn 版本。

错误信息：

代码：

import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
from sklearn.feature_extraction.text import CountVectorizer
from collections import Counter
from wordcloud import WordCloud

vectorizer = CountVectorizer(ngram_range=(2,2), analyzer='word')
sparse_matrix = vectorizer.fit_transform(df['content'][:2000])
frequencies = sum(sparse_matrix).toarray()[0]
ngrams = pd.DataFrame(frequencies, index=vectorizer.get_feature_names_out(), columns=['frequency'])
ngrams = ngrams.sort_values(by='frequency', ascending=False)
ngrams

Answer 1

您使用的是旧版本的 scikit-learn。如果我没记错的话，get_feature_names_out() 是在 1.0 版本才引入的。

升级到较新的版本，或者，要在早期版本中获得类似的功能，您可以使用 get_feature_names()。

CountVectorizer' 对象没有属性 'get_feature_names_out'

CountVectorizer' object has no attribute 'get_feature_names_out'

python

scikit-learn

错误信息：

代码：