为什么 pandas_datareader for google 不起作用?
How come pandas_datareader for google doesn't work?
我尝试通过以下代码从 google 财务中获取数据:
import pandas_datareader.data as wb
import datetime as dt
start = dt.datetime(2015, 1, 1)
end = dt.datetime(2017, 1, 1)
dt = wb.DataReader('FB', 'google', start, end)
dt.head()
我明白了。
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa0 in position 24697: invalid start byte
但是如果我将 'google' 更改为 'yahoo'(通过使用 yahoo finance 代替),它工作正常。那有什么问题吗?
有一个未解决的问题 here。
下面是一个快速修复,从源代码移植,削减并进行一些细微的调整。
我认为问题出在 requests.get()
返回的正文和结果字节的读取上。 (追溯与此一致。)例如,尝试 data = requests.get(url).content
(获取字节);这会失败。下面,data = requests.get(url).text
有效。
我确实没有对此进行严格测试,但 Google API 似乎工作正常。例如,url
生成的导出 link 目前确实可以正常工作。
import datetime
import requests
from io import StringIO
from pandas.io.common import urlencode
import pandas as pd
BASE = 'http://finance.google.com/finance/historical'
def get_params(symbol, start, end):
params = {
'q': symbol,
'startdate': start.strftime('%Y/%m/%d'),
'enddate': end.strftime('%Y/%m/%d'),
'output': "csv"
}
return params
def build_url(symbol, start, end):
params = get_params(symbol, start, end)
return BASE + '?' + urlencode(params)
start = datetime.datetime(2010, 1, 1)
end = datetime.datetime.today()
sym = 'SPY'
url = build_url(sym, start, end)
data = requests.get(url).text
data = pd.read_csv(StringIO(data), index_col='Date', parse_dates=True)
print(data.head())
# Open High Low Close Volume
# Date
# 2017-11-30 263.76 266.05 263.67 265.01 127894389
# 2017-11-29 263.02 263.63 262.20 262.71 77512102
# 2017-11-28 260.76 262.90 260.66 262.87 98971719
# 2017-11-27 260.41 260.75 260.00 260.23 52274922
# 2017-11-24 260.32 260.48 260.16 260.36 27856514
编辑:该问题应在 pandas_datareader 的 0.6.0 版中得到解决。如果没有,请重新打开as bashtage requested。
我尝试通过以下代码从 google 财务中获取数据:
import pandas_datareader.data as wb
import datetime as dt
start = dt.datetime(2015, 1, 1)
end = dt.datetime(2017, 1, 1)
dt = wb.DataReader('FB', 'google', start, end)
dt.head()
我明白了。
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa0 in position 24697: invalid start byte
但是如果我将 'google' 更改为 'yahoo'(通过使用 yahoo finance 代替),它工作正常。那有什么问题吗?
有一个未解决的问题 here。
下面是一个快速修复,从源代码移植,削减并进行一些细微的调整。
我认为问题出在 requests.get()
返回的正文和结果字节的读取上。 (追溯与此一致。)例如,尝试 data = requests.get(url).content
(获取字节);这会失败。下面,data = requests.get(url).text
有效。
我确实没有对此进行严格测试,但 Google API 似乎工作正常。例如,url
生成的导出 link 目前确实可以正常工作。
import datetime
import requests
from io import StringIO
from pandas.io.common import urlencode
import pandas as pd
BASE = 'http://finance.google.com/finance/historical'
def get_params(symbol, start, end):
params = {
'q': symbol,
'startdate': start.strftime('%Y/%m/%d'),
'enddate': end.strftime('%Y/%m/%d'),
'output': "csv"
}
return params
def build_url(symbol, start, end):
params = get_params(symbol, start, end)
return BASE + '?' + urlencode(params)
start = datetime.datetime(2010, 1, 1)
end = datetime.datetime.today()
sym = 'SPY'
url = build_url(sym, start, end)
data = requests.get(url).text
data = pd.read_csv(StringIO(data), index_col='Date', parse_dates=True)
print(data.head())
# Open High Low Close Volume
# Date
# 2017-11-30 263.76 266.05 263.67 265.01 127894389
# 2017-11-29 263.02 263.63 262.20 262.71 77512102
# 2017-11-28 260.76 262.90 260.66 262.87 98971719
# 2017-11-27 260.41 260.75 260.00 260.23 52274922
# 2017-11-24 260.32 260.48 260.16 260.36 27856514
编辑:该问题应在 pandas_datareader 的 0.6.0 版中得到解决。如果没有,请重新打开as bashtage requested。