python - 如何在 Pandas 或任何其他 Python 库中“缩放数据”
问题描述
我正在分析存储“公司名称”、“公司利润”的公司数据集。我还有另一个数据集,其中包含“员工人数”、“反馈(负面或正面)”。我想分析具有更多利润价值的公司是否有更多积极的员工。所以问题是我将拥有数百万或数十亿的“公司利润”,而员工人数将非常少。
那么,我可以在这里缩放数据或做其他事情吗?
欢迎提出建议。
解决方案
如果您有一个如下所示的表:
Company Name Company Profit # of Employees Feedback (Negative or Positive)
0 Alpha 1000000 10 Positive
1 Bravo 13000000 210 Positive
2 Charlie 2300000 16 Negative
3 Delta 130000 1 Negative
并想要一个看起来像这样的表:
Company Name Company Profit (Million) # of Employees Feedback (Negative or Positive)
0 Alpha 1.00 10 Positive
1 Bravo 13.00 210 Positive
2 Charlie 2.30 16 Negative
3 Delta 0.13 1 Negative
然后您可以使用apply
方法和lambda
函数来重新调整数据。
#this part creates the original table
import pandas as pd
columns = ['Company Name', 'Company Profit', '# of Employees', 'Feedback (Negative or Positive)']
df = pd.DataFrame([('Alpha', 1000000, 10, 'Positive'),
('Bravo', 13000000, 210, 'Positive'),
('Charlie', 2300000, 16, 'Negative'),
('Delta', 130000, 1, 'Negative')], columns = columns)
#this part makes the modification
df['Company Profit (Million)'] = df['Company Profit'].apply(lambda x: x/1000000)
df = df [['Company Name', 'Company Profit (Million)', '# of Employees', 'Feedback (Negative or Positive)']]
推荐阅读
- javascript - 如何在 React 中同步组件共享状态挂钩
- php - 000webhost中没有特殊字符的数据库密码问题
- python - 如何使用python google colab将带有边界框的图像存储在文件夹中?
- python - 使用 scipy.integrate odeint 函数时如何修复值错误?
- python - 无法存储 Selenium Web 驱动程序对象以通过 Django 视图恢复它
- javascript - 基于多个条件从复杂数组结构中删除数据
- python - 使用正则表达式 python 提取字符串
- javascript - Promise.all 中的多个文件读取不起作用
- c# - C#:如何使用 IReadOnly 字典实现接口,该字典包含来自包含具体值的具体字典中的接口值
- android - BottomNavigationView 双击