首页 > 解决方案 > 数据抓取:附加数据不起作用

问题描述

我有一个 Excel 文件(Compay、Start_Date、End_Date),我想从中读取组件并查找 NSE 网站上可用的库存数据并将该数据保存到 CSV 文件。

所以我正在尝试这段代码:

cf = pd.read_csv('Company.csv')
cf['START_DT']=pd.to_datetime(cf['START_DT'])
cf['END_DT']=pd.to_datetime(cf['END_DT'])
cf

OUTPUT - 
    COMPANY START_DT    END_DT
0   SBIN    2014-01-01  2018-01-01
1   PNB     2014-01-01  2018-01-01
2   INFY    2014-01-01  2018-01-01

for index,row in cf.iterrows():
    start_dt=row['START_DT']
    end_dt=row['END_DT']
    data = get_history(symbol=row['COMPANY'], start=start_dt, end=end_dt)
    print(data)
data.to_csv('data.csv', sep=',')

但是,存储的数据只是最后一家公司的数据。我试图使用数据框附加数据,但它也不起作用。

我怎样才能解决这个问题?

标签: pythonpandasanaconda

解决方案


这是通过追加和concat一起创建所有数据帧的必要列表:

dfs = []
for index,row in cf.iterrows():
    start_dt=row['START_DT']
    end_dt=row['END_DT']
    data = get_history(symbol=row['COMPANY'], start=start_dt, end=end_dt)
    dfs.append(data)

df = pd.concat(dfs)
df.to_csv('data.csv')

推荐阅读