如何根据另一个列表中的项目从嵌套列表创建第三个列表
How to create a 3rd list from a nested list based on items in another list
我有一些用户的列表
list_of_users=['@elonmusk', '@YouTube','@FortniteGame','@BillGates','@JeffBezos']
以及由推文组成的嵌套列表,按单词拆分。
tweets_splitted_by_words=[['@MrBeastYT', '@BillGates', 'YOU’RE', 'THE', 'LAST', 'ONE', 'FINISH', 'THE', 'MISSION', '#TeamTrees'], ['@MrBeastYT', '@realDonaldTrump', 'do', 'something', 'useful', 'with', 'your', 'life', 'and', 'donate', 'to', '#TeamTrees'], ['Please', 'please', 'donate']]
我想创建由 tweets_splitted_by_words 的子列表创建的第三个新列表,前提是每个子列表至少包含 list_of_users 中的一个用户。
我想要的输出:
output=[['@MrBeastYT', '@BillGates', 'YOU’RE', 'THE', 'LAST', 'ONE', 'FINISH', 'THE', 'MISSION', '#TeamTrees']]
我尝试了以下代码,但没有成功:
tweets_per_user_mentioned= []
giorgia=[]
for r in range(len(tweets_splitted_by_words)):
giorgia.append(r)
for _i in range(len(giorgia)):
if _i in range(len(list_of_users)):
tweets_per_user_mentioned.append(tweets_splitted_by_words[r])
else:
pass
print(tweets_per_user_mentioned)
由于您将对用户列表执行查找,因此最好使用 set
数据结构。 Sets provide O(1)
lookup大大降低了很多问题的时间复杂度。
对于过滤,我只使用 python 的内置 any
和列表理解
set_of_users = set(list_of_users)
filtered_tweets = [tweet for tweet in tweets_splitted_by_words \
if any(word in set_of_users for word in tweet)]
我有一些用户的列表
list_of_users=['@elonmusk', '@YouTube','@FortniteGame','@BillGates','@JeffBezos']
以及由推文组成的嵌套列表,按单词拆分。
tweets_splitted_by_words=[['@MrBeastYT', '@BillGates', 'YOU’RE', 'THE', 'LAST', 'ONE', 'FINISH', 'THE', 'MISSION', '#TeamTrees'], ['@MrBeastYT', '@realDonaldTrump', 'do', 'something', 'useful', 'with', 'your', 'life', 'and', 'donate', 'to', '#TeamTrees'], ['Please', 'please', 'donate']]
我想创建由 tweets_splitted_by_words 的子列表创建的第三个新列表,前提是每个子列表至少包含 list_of_users 中的一个用户。 我想要的输出:
output=[['@MrBeastYT', '@BillGates', 'YOU’RE', 'THE', 'LAST', 'ONE', 'FINISH', 'THE', 'MISSION', '#TeamTrees']]
我尝试了以下代码,但没有成功:
tweets_per_user_mentioned= []
giorgia=[]
for r in range(len(tweets_splitted_by_words)):
giorgia.append(r)
for _i in range(len(giorgia)):
if _i in range(len(list_of_users)):
tweets_per_user_mentioned.append(tweets_splitted_by_words[r])
else:
pass
print(tweets_per_user_mentioned)
由于您将对用户列表执行查找,因此最好使用 set
数据结构。 Sets provide O(1)
lookup大大降低了很多问题的时间复杂度。
对于过滤,我只使用 python 的内置 any
和列表理解
set_of_users = set(list_of_users)
filtered_tweets = [tweet for tweet in tweets_splitted_by_words \
if any(word in set_of_users for word in tweet)]