首页 > 解决方案 > 熊猫:在一列数组上的`array_split`,为什么我找不到该列的最大值

问题描述

我的初始专栏如下所示:

                       spread%  
0  0.002631183029370956687450895171  
1  0.002624478865422741694443794361  
2  0.002503969912244045131633932303  
3  0.002634517528902797001731827513 

(我总共有 95000 行)我想做的是将这些价差分成 100 个箱。这就是我所做的:

spread_range = np.linspace(0.000001, 0.0001, num=300)
dfspread = pd.DataFrame(spread_range,columns=['spread%'])

sorted_array = np.sort(df['spread%'])
dfspread['spread%']=np.array_split(sorted_array, 300)
dfspread['spread%'] = dfspread['spread%'].str[1]

我必须首先创建一个带有随机值(spread_range)的数据框,然后用好的值(最后一行)替换这些值。我不知道如何一步完成......这是我的输出:

                                     spread% 
295     0.006396490507889923995723419182
296     0.006601856970328614032555077092
297     0.006874901899230889970177366191
298     0.007286400912994813194530809917
299     0.008012436834225554885192314445

但我没有找到我的最大值:0.02828190624663463264290952354 知道为什么吗?

标签: pythonpandasnumpy

解决方案


推荐阅读