CountVectorizer' 对象没有属性 'get_feature_names_out'
CountVectorizer' object has no attribute 'get_feature_names_out'
为什么我总是收到这个错误?我尝试了不同版本的 anaconda 3,但没有成功。我应该安装什么才能正常工作?我使用 0.20 - 0.23 的 sklearn 版本。
错误信息:
代码:
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
from sklearn.feature_extraction.text import CountVectorizer
from collections import Counter
from wordcloud import WordCloud
vectorizer = CountVectorizer(ngram_range=(2,2), analyzer='word')
sparse_matrix = vectorizer.fit_transform(df['content'][:2000])
frequencies = sum(sparse_matrix).toarray()[0]
ngrams = pd.DataFrame(frequencies, index=vectorizer.get_feature_names_out(), columns=['frequency'])
ngrams = ngrams.sort_values(by='frequency', ascending=False)
ngrams
您使用的是旧版本的 scikit-learn。如果我没记错的话,get_feature_names_out()
是在 1.0 版本才引入的。
升级到较新的版本,或者,要在早期版本中获得类似的功能,您可以使用 get_feature_names()
。
为什么我总是收到这个错误?我尝试了不同版本的 anaconda 3,但没有成功。我应该安装什么才能正常工作?我使用 0.20 - 0.23 的 sklearn 版本。
错误信息:
代码:
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
from sklearn.feature_extraction.text import CountVectorizer
from collections import Counter
from wordcloud import WordCloud
vectorizer = CountVectorizer(ngram_range=(2,2), analyzer='word')
sparse_matrix = vectorizer.fit_transform(df['content'][:2000])
frequencies = sum(sparse_matrix).toarray()[0]
ngrams = pd.DataFrame(frequencies, index=vectorizer.get_feature_names_out(), columns=['frequency'])
ngrams = ngrams.sort_values(by='frequency', ascending=False)
ngrams
您使用的是旧版本的 scikit-learn。如果我没记错的话,get_feature_names_out()
是在 1.0 版本才引入的。
升级到较新的版本,或者,要在早期版本中获得类似的功能,您可以使用 get_feature_names()
。