r - 使用奇怪的结构化数据进行回归
问题描述
我有一个数据框,其中包含来自 500 个不同用户的推文。每个用户有 1-200 条推文。对于每条推文,我都记录了用户拥有的关注者数量,以及推文的参与度(转推 + 收藏)。我现在正在尝试以 DV 和追随者作为我的 IV 的参与度来运行 lm 回归。
问题是IV(追随者)既是分类的又是连续的。对于数据集中有 200 条推文的用户,将有 200 条推文具有相同数量的追随者。基本上,IV 是分类的,在 8000 和 190 万之间有 500 个不同的类别。结果是我的情节中的数据点被“堆叠”在彼此之上,并且调节线受到影响。有没有办法可以重组/转换我的数据,以便我可以在视觉上进行更好的线性表示?(线性关系本身通过 lm 的运行摘要得到证实)。
希望有人理解这个相当奇怪的问题,可以帮我一把!
解决方案
推荐阅读
- operating-system - 为什么在生产者消费者问题中我们需要 2 个信号量变量?
- r - 如何在ggplot2中绘制具有正确间隔的连续x轴值的箱线图
- java - 无法找到元素的 Spring NamespaceHandler
- python - 如何制作计数器的子集?
- pandas - 使用 matplotlib 计算 pandas 列数据库和条形图中的出现次数
- git - 暂时恢复 git 中的功能
- java - IntelliJ IDEA 在哪里保存运行/调试配置?
- javascript - JsPDF,如何获取 javascript 变量
- detox - 排毒 - 如何在不使用期望的情况下检查元素是否存在
- java - 如何将图像数据复制到 BufferedImage 的子类中?