首页 > 解决方案 > 使用奇怪的结构化数据进行回归

问题描述

我有一个数据框,其中包含来自 500 个不同用户的推文。每个用户有 1-200 条推文。对于每条推文,我都记录了用户拥有的关注者数量,以及推文的参与度(转推 + 收藏)。我现在正在尝试以 DV 和追随者作为我的 IV 的参与度来运行 lm 回归。

问题是IV(追随者)既是分类的又是连续的。对于数据集中有 200 条推文的用户,将有 200 条推文具有相同数量的追随者。基本上,IV 是分类的,在 8000 和 190 万之间有 500 个不同的类别。结果是我的情节中的数据点被“堆叠”在彼此之上,并且调节线受到影响。有没有办法可以重组/转换我的数据,以便我可以在视觉上进行更好的线性表示?(线性关系本身通过 lm 的运行摘要得到证实)。

希望有人理解这个相当奇怪的问题,可以帮我一把!

标签: r

解决方案


推荐阅读