将推文创建时间转换为 UTC

Convert tweet creation time to UTC

构建 Twitter 爬虫我一直在将推文创建日期时间(我将其作为本地时区)转换为 UTC。

data-original-title 的创建日期 - 属性的格式为 12:17 AM - 8 Apr 2018。如何将其转换为 UTC?

首先,您需要将字符串转换为 python 日期时间格式,然后我建议您使用 pytz 模块将使用的时区更改为 UTC 时区,如下例所示:

import datetime
import pytz
a = '12:17 AM - 8 Apr 2018'
final = datetime.datetime.strptime(a, '%I:%M %p - %d %b %Y').replace(tzinfo=pytz.UTC)
print(final)
# 2018-04-08 00:17:00+00:00

此外,如果您想将转换后的时间检查为字符串表示形式,您可以这样做:

str_time = final.strftime('%d/%m/%Y %H:%M:%S')
print(str_time)
# '08/04/2018 00:17:00'

Ps:如果您的电脑中没有安装pytz模块,您可以通过以下方式安装:

sudo pip install pytz

尝试以下:

import pandas as pd
datestr = '12:17 AM - 8 Apr 2018'
utcDate = pd.to_datetime(datestr, format='%H:%M %p  - %d %b %Y', utc=True)