将推文创建时间转换为 UTC
Convert tweet creation time to UTC
构建 Twitter 爬虫我一直在将推文创建日期时间(我将其作为本地时区)转换为 UTC。
data-original-title
的创建日期 - 属性的格式为 12:17 AM - 8 Apr 2018
。如何将其转换为 UTC?
首先,您需要将字符串转换为 python 日期时间格式,然后我建议您使用 pytz
模块将使用的时区更改为 UTC 时区,如下例所示:
import datetime
import pytz
a = '12:17 AM - 8 Apr 2018'
final = datetime.datetime.strptime(a, '%I:%M %p - %d %b %Y').replace(tzinfo=pytz.UTC)
print(final)
# 2018-04-08 00:17:00+00:00
此外,如果您想将转换后的时间检查为字符串表示形式,您可以这样做:
str_time = final.strftime('%d/%m/%Y %H:%M:%S')
print(str_time)
# '08/04/2018 00:17:00'
Ps:如果您的电脑中没有安装pytz
模块,您可以通过以下方式安装:
sudo pip install pytz
尝试以下:
import pandas as pd
datestr = '12:17 AM - 8 Apr 2018'
utcDate = pd.to_datetime(datestr, format='%H:%M %p - %d %b %Y', utc=True)
构建 Twitter 爬虫我一直在将推文创建日期时间(我将其作为本地时区)转换为 UTC。
data-original-title
的创建日期 - 属性的格式为 12:17 AM - 8 Apr 2018
。如何将其转换为 UTC?
首先,您需要将字符串转换为 python 日期时间格式,然后我建议您使用 pytz
模块将使用的时区更改为 UTC 时区,如下例所示:
import datetime
import pytz
a = '12:17 AM - 8 Apr 2018'
final = datetime.datetime.strptime(a, '%I:%M %p - %d %b %Y').replace(tzinfo=pytz.UTC)
print(final)
# 2018-04-08 00:17:00+00:00
此外,如果您想将转换后的时间检查为字符串表示形式,您可以这样做:
str_time = final.strftime('%d/%m/%Y %H:%M:%S')
print(str_time)
# '08/04/2018 00:17:00'
Ps:如果您的电脑中没有安装pytz
模块,您可以通过以下方式安装:
sudo pip install pytz
尝试以下:
import pandas as pd
datestr = '12:17 AM - 8 Apr 2018'
utcDate = pd.to_datetime(datestr, format='%H:%M %p - %d %b %Y', utc=True)