更新:收集阿拉伯语推文并使用 python 将其保存在 csv 中

Update : collecting Arabic tweets and save it in csv using python

我在收集阿拉伯语推文并将其保存在 CSV 文件中时遇到问题

当我打开 CSV 文件时,推文是这样的

这是代码


import tweepy
import csv


# Twitter API credentials

consumer_key = "..."
consumer_secret = ".."
access_key = "..."
access_secret = "...."

auth= tweepy.OAuthHandler(consumer_key,consumer_secret)
auth.set_access_token(access_key,access_secret)
api= tweepy.API(auth,wait_on_rate_limit=True)


csvFile=open('tweets.csv','a',newline='')
csvWriter=csv.writer(csvFile)
#truncated=False,
for tweet in tweepy.Cursor(api.search,q="اكتئاب",since="2021-01-30",truncated=False,tweet_mode="extended", count=1).items():

    if (not tweet.retweeted) and ('RT @' not in tweet.full_text):
        csvWriter.writerow([tweet.full_text.encode('utf-8-sig')])

我需要你的帮助:'(

  1. 对于您得到的空行,see this answer
    • 将参数newline=''添加到open(...)语句
  2. 要获取完整的推文文本(280 个字符),请在调用 API and/or 和 Cursor() 时使用 Extended Mode
    • tweet_mode='extended'
    • 并使用参数 full_text 而不是 text 来获取每条推文的文本。
    • 您还需要 handle retweets 略有不同。
  3. 有关完整网址,请参阅此
    for url in status.entities['urls']:
        links = url['expanded_url']
    

我找到了我的答案,如果我将这两行添加到我的代码中,它就会修复它

#coding:utf8
csvFile=open('tweets.csv','a',newline='',encoding='utf-8-sig')