首页 > 解决方案 > 返回整个数据帧是不好的代码吗?分离预处理和建模的pythonic方法是什么?

问题描述

我正在阅读一位同事的代码,他将预处理和模型构建模块分成单独的 .py 文件,如下所示:

def read_datasourceX_data(path, filenames):
    """
    A function to perform read data
    :rtype data: pd.DataFrame
    """
    return datasourceX_df

def match_datasourceX_to_someID(datasourceX_df, datasourceID_df, x, y):
    """
    A function to perform read datasourceX_df and datasourceID_df
    :rtype data: pd.DataFrame
    """
    return matched_df

这些函数返回了很多数据帧。它增加了可读性。这是pythonic吗?

编辑:我想,使用 apply() 更符合 Python 风格,但是如何在不影响可读性的情况下组织我的代码呢?

编辑:为了更清楚的问题:在使用 apply() 和将数据帧传递给返回另一个(同样大的)数据帧的函数之间,您会选择哪个。是的,它有点基于意见,因为这是“最佳实践”的本质。请不要将此标记为基于意见。

标签: pythonpandasperformance

解决方案


推荐阅读