首页 > 解决方案 > 具有不同长度的解释变量的 OLS 回归

问题描述

我已经计算了从 1926 年到 2012 年的 Betting Against Beta 策略的回报,并希望以 Mkt-RF、HML、SMB、MOM 和流动性因素作为自变量进行 OLS 回归。问题是流动性数据的数据始于 1968 年。我是否必须从 1968 年开始回归,或者有没有办法从 1968 年开始包含 LIQ 因子?我正在用 Python 编码

标签: regression

解决方案


您可以添加新的二进制变量来指示何时填充数据以及何时不填充。如果在数据不存在时使用 1 并将缺失数据设置为 0,则可以创建调整项。您也可以用估计值替换数据,尽管这会引入偏差。这是一般指南

这可能会对 OLS 回归背后的假设产生一些影响,因此您需要额外确保这些假设与您的数据集保持一致,以便有信心得出结论。假设在这里得到了很好的阐述。


推荐阅读