遍历 EOD .csv 以在每个文件中创建历史 运行 高、低
Iterate through EOD .csv's to create a historical running high, low in each file
我是 python 的新手,但随着我对它的理解越来越深,我爱上了它。话虽这么说,我已经设法拼凑了一个脚本,将 Quandl WIKI EOD 数据库转储到每个股票的 CSV 文件中。我在下面包含了 (Python 2.7):
import pandas as pd
import Quandl
#this ignores the first symbol in tickers.txt, add a header!
symbols_list = list(pd.read_csv('tickers.txt', index_col=0).T)
print symbols_list
df = {}
for ticker in symbols_list:
stock = str("WIKI/" + ticker + ".11")
#print stock
print str(ticker + ".csv")
df[ticker] = Quandl.get(stock, authtoken="XXXXXXXXXXXXX", trim_start="2016-01-01")
df[ticker].to_csv(str(ticker + ".csv"))
我的下一个目标是为每个股票 csv 创建一个历史 运行 高点和低点列。这将使创建类似于 http://www.finviz.com/ 上的股票市场的历史 "gas gauge" 变得容易。新的 high/new 低规非常有用。当 2000 多只股票创下新低而只有少数股票创下新高时,很容易衡量抛售的难度。
到目前为止,我已经成功地遍历了我工作文件夹中的每个 .csv 文件,并记录了每个新高/新低。我的挂断是将此信息作为新列输入每个 csv 的正确方法。每个 EOD CSV 都有 ['Date'、'Adj. Close'] 和 headers,我想添加 ['High'、'Low']。
到目前为止我的代码:
import os
import pandas as pd
csv = [f for f in os.listdir('.') if f.endswith('.csv')]
print csv
for i in csv:
df = pd.read_csv(i, index_col=0, parse_dates=True)
print df
j=0
k=0
for i in df['Adj. Close']: #for each value in adj close
if j==0:
j=i
k=i
elif i>j:
j=i #high
elif i<k:
k=i #low
print j,k #print high & low
非常感谢你们的帮助!
所有的代码片段和回答的问题都让学习变得更加愉快 python。
到目前为止,这是脚本的输出:
['A.csv', 'AA.csv']
Adj. Close
Date
2016-01-04 40.69
2016-01-05 40.55
2016-01-06 40.73
2016-01-07 39.00
2016-01-08 38.59
2016-01-11 37.94
2016-01-12 38.19
2016-01-13 36.86
2016-01-14 37.61
2016-01-15 37.11
2016-01-19 37.20
2016-01-20 37.26
2016-01-21 37.23
2016-01-22 37.98
40.69 40.69
40.69 40.55
40.73 40.55
40.73 39.0
40.73 38.59
40.73 37.94
40.73 37.94
40.73 36.86
40.73 36.86
40.73 36.86
40.73 36.86
40.73 36.86
40.73 36.86
40.73 36.86
Adj. Close
Date
2016-01-04 9.71
2016-01-05 9.27
2016-01-06 8.61
2016-01-07 8.27
2016-01-08 8.07
2016-01-11 8.00
2016-01-12 7.28
2016-01-13 7.13
2016-01-14 7.24
2016-01-15 6.90
2016-01-19 6.74
2016-01-20 6.74
2016-01-21 7.09
2016-01-22 6.87
9.71 9.71
9.71 9.27
9.71 8.61
9.71 8.27
9.71 8.07
9.71 8.0
9.71 7.28
9.71 7.13
9.71 7.13
9.71 6.9
9.71 6.74
9.71 6.74
9.71 6.74
9.71 6.74
此代码运行良好:
import os
import pandas as pd
csv = [f for f in os.listdir('.') if f.endswith('.csv')]
print csv
for i in csv:
df = pd.read_csv(i, index_col=0, parse_dates=True)
#print df
df['High'] = pd.rolling_max(df['Adj. Close'], window=df.shape[0], min_periods=1)
df['Low'] = pd.rolling_min(df['Adj. Close'], window=df.shape[0], min_periods=1)
#print df
g = os.path.normcase(os.path.join(os.path.dirname(__file__), i)) #os.getcwd()
print 'full path =', g
with open(g , "w") as f:
df.to_csv(f)
现在我将了解如何创建每天新的 high/new 低点
的历史列表
您可以使用 df
- shape
as window
of rolling_min
and rolling_max
:
的长度
print df
Date Adj. Close
0 2016-01-04 9.71
1 2016-01-05 9.27
2 2016-01-06 8.61
3 2016-01-07 8.27
4 2016-01-08 8.07
5 2016-01-11 8.00
6 2016-01-12 7.28
7 2016-01-13 7.13
8 2016-01-14 7.24
9 2016-01-15 6.90
10 2016-01-19 6.74
11 2016-01-20 6.74
12 2016-01-21 7.09
13 2016-01-22 6.87
df['high'] = pd.rolling_max(df['Adj. Close'], window=df.shape[0], min_periods=1)
df['low'] = pd.rolling_min(df['Adj. Close'], window=df.shape[0], min_periods=1)
print df
Date Adj. Close high low
0 2016-01-04 9.71 9.71 9.71
1 2016-01-05 9.27 9.71 9.27
2 2016-01-06 8.61 9.71 8.61
3 2016-01-07 8.27 9.71 8.27
4 2016-01-08 8.07 9.71 8.07
5 2016-01-11 8.00 9.71 8.00
6 2016-01-12 7.28 9.71 7.28
7 2016-01-13 7.13 9.71 7.13
8 2016-01-14 7.24 9.71 7.13
9 2016-01-15 6.90 9.71 6.90
10 2016-01-19 6.74 9.71 6.74
11 2016-01-20 6.74 9.71 6.74
12 2016-01-21 7.09 9.71 6.74
13 2016-01-22 6.87 9.71 6.74
您需要 pandas rollingmax 和 rollingmin 函数! :-)
http://pandas.pydata.org/pandas-docs/version/0.17.0/generated/pandas.rolling_max.html
我是 python 的新手,但随着我对它的理解越来越深,我爱上了它。话虽这么说,我已经设法拼凑了一个脚本,将 Quandl WIKI EOD 数据库转储到每个股票的 CSV 文件中。我在下面包含了 (Python 2.7):
import pandas as pd
import Quandl
#this ignores the first symbol in tickers.txt, add a header!
symbols_list = list(pd.read_csv('tickers.txt', index_col=0).T)
print symbols_list
df = {}
for ticker in symbols_list:
stock = str("WIKI/" + ticker + ".11")
#print stock
print str(ticker + ".csv")
df[ticker] = Quandl.get(stock, authtoken="XXXXXXXXXXXXX", trim_start="2016-01-01")
df[ticker].to_csv(str(ticker + ".csv"))
我的下一个目标是为每个股票 csv 创建一个历史 运行 高点和低点列。这将使创建类似于 http://www.finviz.com/ 上的股票市场的历史 "gas gauge" 变得容易。新的 high/new 低规非常有用。当 2000 多只股票创下新低而只有少数股票创下新高时,很容易衡量抛售的难度。
到目前为止,我已经成功地遍历了我工作文件夹中的每个 .csv 文件,并记录了每个新高/新低。我的挂断是将此信息作为新列输入每个 csv 的正确方法。每个 EOD CSV 都有 ['Date'、'Adj. Close'] 和 headers,我想添加 ['High'、'Low']。
到目前为止我的代码:
import os
import pandas as pd
csv = [f for f in os.listdir('.') if f.endswith('.csv')]
print csv
for i in csv:
df = pd.read_csv(i, index_col=0, parse_dates=True)
print df
j=0
k=0
for i in df['Adj. Close']: #for each value in adj close
if j==0:
j=i
k=i
elif i>j:
j=i #high
elif i<k:
k=i #low
print j,k #print high & low
非常感谢你们的帮助! 所有的代码片段和回答的问题都让学习变得更加愉快 python。
到目前为止,这是脚本的输出:
['A.csv', 'AA.csv']
Adj. Close
Date
2016-01-04 40.69
2016-01-05 40.55
2016-01-06 40.73
2016-01-07 39.00
2016-01-08 38.59
2016-01-11 37.94
2016-01-12 38.19
2016-01-13 36.86
2016-01-14 37.61
2016-01-15 37.11
2016-01-19 37.20
2016-01-20 37.26
2016-01-21 37.23
2016-01-22 37.98
40.69 40.69
40.69 40.55
40.73 40.55
40.73 39.0
40.73 38.59
40.73 37.94
40.73 37.94
40.73 36.86
40.73 36.86
40.73 36.86
40.73 36.86
40.73 36.86
40.73 36.86
40.73 36.86
Adj. Close
Date
2016-01-04 9.71
2016-01-05 9.27
2016-01-06 8.61
2016-01-07 8.27
2016-01-08 8.07
2016-01-11 8.00
2016-01-12 7.28
2016-01-13 7.13
2016-01-14 7.24
2016-01-15 6.90
2016-01-19 6.74
2016-01-20 6.74
2016-01-21 7.09
2016-01-22 6.87
9.71 9.71
9.71 9.27
9.71 8.61
9.71 8.27
9.71 8.07
9.71 8.0
9.71 7.28
9.71 7.13
9.71 7.13
9.71 6.9
9.71 6.74
9.71 6.74
9.71 6.74
9.71 6.74
此代码运行良好:
import os
import pandas as pd
csv = [f for f in os.listdir('.') if f.endswith('.csv')]
print csv
for i in csv:
df = pd.read_csv(i, index_col=0, parse_dates=True)
#print df
df['High'] = pd.rolling_max(df['Adj. Close'], window=df.shape[0], min_periods=1)
df['Low'] = pd.rolling_min(df['Adj. Close'], window=df.shape[0], min_periods=1)
#print df
g = os.path.normcase(os.path.join(os.path.dirname(__file__), i)) #os.getcwd()
print 'full path =', g
with open(g , "w") as f:
df.to_csv(f)
现在我将了解如何创建每天新的 high/new 低点
的历史列表您可以使用 df
- shape
as window
of rolling_min
and rolling_max
:
print df
Date Adj. Close
0 2016-01-04 9.71
1 2016-01-05 9.27
2 2016-01-06 8.61
3 2016-01-07 8.27
4 2016-01-08 8.07
5 2016-01-11 8.00
6 2016-01-12 7.28
7 2016-01-13 7.13
8 2016-01-14 7.24
9 2016-01-15 6.90
10 2016-01-19 6.74
11 2016-01-20 6.74
12 2016-01-21 7.09
13 2016-01-22 6.87
df['high'] = pd.rolling_max(df['Adj. Close'], window=df.shape[0], min_periods=1)
df['low'] = pd.rolling_min(df['Adj. Close'], window=df.shape[0], min_periods=1)
print df
Date Adj. Close high low
0 2016-01-04 9.71 9.71 9.71
1 2016-01-05 9.27 9.71 9.27
2 2016-01-06 8.61 9.71 8.61
3 2016-01-07 8.27 9.71 8.27
4 2016-01-08 8.07 9.71 8.07
5 2016-01-11 8.00 9.71 8.00
6 2016-01-12 7.28 9.71 7.28
7 2016-01-13 7.13 9.71 7.13
8 2016-01-14 7.24 9.71 7.13
9 2016-01-15 6.90 9.71 6.90
10 2016-01-19 6.74 9.71 6.74
11 2016-01-20 6.74 9.71 6.74
12 2016-01-21 7.09 9.71 6.74
13 2016-01-22 6.87 9.71 6.74
您需要 pandas rollingmax 和 rollingmin 函数! :-)
http://pandas.pydata.org/pandas-docs/version/0.17.0/generated/pandas.rolling_max.html