首页 > 解决方案 > 删除重复数据并将其余数据附加到 pandas

问题描述

我有以下代码:

import pandas as pd
import datetime
import pandas as pd
from pandas_datareader import data as web
import matplotlib.pyplot as plt
from alpha_vantage.foreignexchange import ForeignExchange
import os
from os import path
from alpha_vantage.timeseries import TimeSeries 
import matplotlib.pyplot as plt 
import sys



while True:
    if path.exists('stockdata.csv') == True:
        data1 = pd.read_csv('stockdata.csv')
        ts = TimeSeries(key='1ORS1XLM1YK1GK9Y', output_format='pandas')
        data, meta_data = ts.get_intraday(symbol = 'spy', interval='1min', outputsize='full')
        data = data.rename(columns={'1. open':'Open','2. high': 'High','3. low': 'Low', '4. close':'Close', '5. volume': 'Volume'})
        data1 = data1.append(data)
        data1.to_csv('stockdata.csv', sep= ' ')
        break
    else:
        data1 = pd.DataFrame(columns=['Open','High','Low', 'Close','Volume'])
        data1.to_csv('stockdata.csv', sep= ' ')

我要做的是检查文件stockdata.csv是否在当前目录中。如果找不到,则创建文件。

如果找到该文件,则下载间谍代码数据data并将该数据附加到data1并保存在 csv 文件中。

这假设运行 24/7,我将包括一个 12 小时睡眠计时器,因此每 12 小时它会更新数据。

标签: pythonpandaswhile-loop

解决方案


drop_duplicates做你需要的吗?

data1 = data1.drop_duplicates()

推荐阅读