首页 > 解决方案 > 如何在 Pandas 或任何其他 Python 库中“缩放数据”

问题描述

我正在分析存储“公司名称”、“公司利润”的公司数据集。我还有另一个数据集,其中包含“员工人数”、“反馈(负面或正面)”。我想分析具有更多利润价值的公司是否有更多积极的员工。所以问题是我将拥有数百万或数十亿的“公司利润”,而员工人数将非常少。

那么,我可以在这里缩放数据或做其他事情吗?

欢迎提出建议。

标签: pythonpandas

解决方案


如果您有一个如下所示的表:

  Company Name  Company Profit  # of Employees Feedback (Negative or Positive)
0        Alpha         1000000              10                        Positive
1        Bravo        13000000             210                        Positive
2      Charlie         2300000              16                        Negative
3        Delta          130000               1                        Negative

并想要一个看起来像这样的表:

 Company Name  Company Profit (Million)  # of Employees     Feedback (Negative or Positive)  
0        Alpha                      1.00              10                 Positive  
1        Bravo                     13.00             210                 Positive  
2      Charlie                      2.30              16                 Negative  
3        Delta                      0.13               1                 Negative  

然后您可以使用apply方法和lambda函数来重新调整数据。

#this part creates the original table 
import pandas as pd
columns = ['Company Name', 'Company Profit', '# of Employees', 'Feedback (Negative or Positive)']
df = pd.DataFrame([('Alpha', 1000000, 10, 'Positive'), 
                   ('Bravo', 13000000, 210, 'Positive'),
                   ('Charlie', 2300000, 16, 'Negative'),
                   ('Delta', 130000, 1, 'Negative')], columns = columns)
#this part makes the modification
df['Company Profit (Million)'] = df['Company Profit'].apply(lambda x: x/1000000)
df = df [['Company Name', 'Company Profit (Million)', '# of Employees', 'Feedback (Negative or Positive)']]

推荐阅读