首页 > 解决方案 > DataFrame多目标排序来定义帕累托边界

问题描述

Pandas 中是否内置了多目标排序算法?

我发现是一个 NSGA-II 算法(这是我想要的),但它需要将目标函数作为单独的文件传递。在理想情况下,我会为所有数据使用 DataFrame,multi_of_sort在指定目标函数列(和其他必需参数)时调用类似的方法,它会返回另一个具有 Pareto 最优值的 DataFrame。

这似乎对 Pandas 来说应该是微不足道的,但我可能是错的。

标签: pythonpandassortingoptimization

解决方案


事实证明......上面引用的pareto确实处理 DataFrame 输入。

import pareto
import pandas as pd

# load the data
df = pd.read_csv('data.csv')

# define the objective function column indices
# optional. default is ALL columns
of_cols = [4, 5]

# define the convergence tolerance for the OF's
# optional. default is 1e-9
eps_tols = [1, 2]

# sort
nondominated = pareto.eps_sort([list(df.itertuples(False))], of_cols, eps_tols)

# convert multi-dimension array to DataFrame
df_pareto = pd.DataFrame.from_records(nondominated, columns=list(df.columns.values))

推荐阅读