首页 > 解决方案 > 将大小不等的宽数据框重塑为长格式

问题描述

我已经开始进行情绪分析,但是在将词典转换为所需格式时遇到问题

我的数据看起来像这样:

单词 替代形式1 另类形式2 价值
阿布马兴 阿布格马赫特 抽象的 0.4
实际操作 实际操作 不适用 0.2

我需要它看起来像这样

单词 价值
阿布马兴 0.4
阿布格马赫特 0.4
抽象的 0.4
实际操作 0.2
实际操作 0.2

你能帮我找到简单的方法吗?非常感谢 :)

标签: rreshape

解决方案


你可以使用

library(dplyr)
library(tidyr)

df %>% 
  pivot_longer(-value, values_to = "word") %>% 
  drop_na(word) %>% 
  select(word, value)

这返回

# A tibble: 5 x 2
  word             value
  <chr>            <dbl>
1 abmachen           0.4
2 abgemacht          0.4
3 abmachst           0.4
4 Aktualisierung     0.2
5 Aktualisierungen   0.2

推荐阅读