Python 列表未正确附加到循环中
Python list not appending correctly in a loop
我正在做一个 Tweepy/Django/nltk 项目,其中我有一个列表,该列表将针对搜索到的推文进行更新。这是我遇到问题的部分:
query = 'happy'
max_tweets=5
search_results = {}
sentiments = {}
sentilist = []
for status in tweepy.Cursor(api.search, q=query).items(max_tweets):
search_results[status.text] = unicode(status.text)
search_results[status.text] = search_results[status.text].replace('|', ' ')
search_results[status.text] = search_results[status.text].replace('\n', ' ')
print(senti.linearsvc10(status.text))
sentiments['tweet'] = unicode(search_results[status.text])
sentiments['sentiment'] = senti.linearsvc10(unicode(status.text))
sentilist.append(sentiments)
print('inloop sentiments')
print sentiments
print('inloop sentilist')
print sentilist
print('sentiments')
print sentiments
print('sentilist')
print sentilist
基本上,情绪将等于
{'tweet': 'Actual tweet here', 'sentiment': 'pos'}
所以对于循环的每个 运行,我希望将情绪附加到列表中,所以到最后,列表中将有 5 个不同的对象。但实际发生的是每次追加到 sentilist,它会将列表中的每个项目更改为最后追加的对象。例如,以下是个人情绪对象:
{'tweet': 'tweet1', 'sentiment': 'pos'}
{'tweet': 'tweet2', 'sentiment': 'neg'}
{'tweet': 'tweet3', 'sentiment': 'neg'}
{'tweet': 'tweet4', 'sentiment': 'pos'}
{'tweet': 'tweet5', 'sentiment': 'neg'}
附加到 sentilist 时应该是:
[{'tweet': 'tweet1', 'sentiment': 'pos'},
{'tweet': 'tweet2', 'sentiment': 'neg'},
{'tweet': 'tweet3', 'sentiment': 'neg'},
{'tweet': 'tweet4', 'sentiment': 'pos'},
{'tweet': 'tweet5', 'sentiment': 'neg'}]
但它变成了:
[{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'}]
我的代码的其他部分工作,我觉得有一个简单的解决方案,但我仍然无法弄清楚。
你需要在每个循环中创建一个新字典sentiments
:
for status in tweepy.Cursor(api.search, q=query).items(max_tweets):
sentiments = {}
你一次又一次地覆盖同一个字典中的值,并在每个循环中附加这个同一个字典。因此,您会在列表 sentilist
.
的所有条目中看到上次字典更新的值
我正在做一个 Tweepy/Django/nltk 项目,其中我有一个列表,该列表将针对搜索到的推文进行更新。这是我遇到问题的部分:
query = 'happy'
max_tweets=5
search_results = {}
sentiments = {}
sentilist = []
for status in tweepy.Cursor(api.search, q=query).items(max_tweets):
search_results[status.text] = unicode(status.text)
search_results[status.text] = search_results[status.text].replace('|', ' ')
search_results[status.text] = search_results[status.text].replace('\n', ' ')
print(senti.linearsvc10(status.text))
sentiments['tweet'] = unicode(search_results[status.text])
sentiments['sentiment'] = senti.linearsvc10(unicode(status.text))
sentilist.append(sentiments)
print('inloop sentiments')
print sentiments
print('inloop sentilist')
print sentilist
print('sentiments')
print sentiments
print('sentilist')
print sentilist
基本上,情绪将等于
{'tweet': 'Actual tweet here', 'sentiment': 'pos'}
所以对于循环的每个 运行,我希望将情绪附加到列表中,所以到最后,列表中将有 5 个不同的对象。但实际发生的是每次追加到 sentilist,它会将列表中的每个项目更改为最后追加的对象。例如,以下是个人情绪对象:
{'tweet': 'tweet1', 'sentiment': 'pos'}
{'tweet': 'tweet2', 'sentiment': 'neg'}
{'tweet': 'tweet3', 'sentiment': 'neg'}
{'tweet': 'tweet4', 'sentiment': 'pos'}
{'tweet': 'tweet5', 'sentiment': 'neg'}
附加到 sentilist 时应该是:
[{'tweet': 'tweet1', 'sentiment': 'pos'},
{'tweet': 'tweet2', 'sentiment': 'neg'},
{'tweet': 'tweet3', 'sentiment': 'neg'},
{'tweet': 'tweet4', 'sentiment': 'pos'},
{'tweet': 'tweet5', 'sentiment': 'neg'}]
但它变成了:
[{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'},
{'tweet': 'tweet5', 'sentiment': 'neg'}]
我的代码的其他部分工作,我觉得有一个简单的解决方案,但我仍然无法弄清楚。
你需要在每个循环中创建一个新字典sentiments
:
for status in tweepy.Cursor(api.search, q=query).items(max_tweets):
sentiments = {}
你一次又一次地覆盖同一个字典中的值,并在每个循环中附加这个同一个字典。因此,您会在列表 sentilist
.