Tweepy- 检索最流行的两个主题标签
Tweepy- retrieve the most popular two hashtags
我是 Spark Streaming 的初学者。
我正在测试一些可用的代码,但我想用它做些别的事情。我只想检索我帐户中最流行的两个主题标签。
class StdOutListener(StreamListener):
def on_data(self, data):
print data
return True
def on_error(self, status):
print status
if __name__ == '__main__':
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=['python'])
我该怎么做?
非常感谢。
可能的解决方案如下(完整示例 here):
class StdOutListener(StreamListener):
def on_data(self, data):
print(data)
return True
def on_error(self, status):
print(status)
if __name__ == '__main__':
hashtags_dict = {}
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)
tweets = api.user_timeline(screen_name='<your_screen_name',count=200)
for tweet in tweets:
hashtags = tweet.entities.get('hashtags')
for hashtag in hashtags:
if hashtag['text'] in hashtags_dict.keys():
hashtags_dict[hashtag['text']] += 1
else:
hashtags_dict[hashtag['text']] = 1
print(sorted(hashtags_dict, key=hashtags_dict.get, reverse=True)[:2])
我添加到您的脚本的新部分从您的帐户中获取 200 条推文,并循环每条推文以获取相关主题标签。
每个主题标签都将作为键添加到字典中 (hashtags_dict),并作为值添加主题标签已使用的次数。
最后,我在字典中得到了最大值的两个键,它们对应于您帐户中最流行的两个主题标签。
您只能同时获取 200 条推文,这是允许的最大数量。如果您想获取所有推文,请查看此 script
告诉我。
我是 Spark Streaming 的初学者。 我正在测试一些可用的代码,但我想用它做些别的事情。我只想检索我帐户中最流行的两个主题标签。
class StdOutListener(StreamListener):
def on_data(self, data):
print data
return True
def on_error(self, status):
print status
if __name__ == '__main__':
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=['python'])
我该怎么做?
非常感谢。
可能的解决方案如下(完整示例 here):
class StdOutListener(StreamListener):
def on_data(self, data):
print(data)
return True
def on_error(self, status):
print(status)
if __name__ == '__main__':
hashtags_dict = {}
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)
tweets = api.user_timeline(screen_name='<your_screen_name',count=200)
for tweet in tweets:
hashtags = tweet.entities.get('hashtags')
for hashtag in hashtags:
if hashtag['text'] in hashtags_dict.keys():
hashtags_dict[hashtag['text']] += 1
else:
hashtags_dict[hashtag['text']] = 1
print(sorted(hashtags_dict, key=hashtags_dict.get, reverse=True)[:2])
我添加到您的脚本的新部分从您的帐户中获取 200 条推文,并循环每条推文以获取相关主题标签。 每个主题标签都将作为键添加到字典中 (hashtags_dict),并作为值添加主题标签已使用的次数。
最后,我在字典中得到了最大值的两个键,它们对应于您帐户中最流行的两个主题标签。
您只能同时获取 200 条推文,这是允许的最大数量。如果您想获取所有推文,请查看此 script
告诉我。