首页 > 解决方案 > 分隔数据的字符值(R 代码)

问题描述

我有一个数据集的特定列,其中包含 1 个响应的多个答案选择:

market_purchases
Meats & Poultry, Seafood, Vegetables    
Meats & Poultry, Vegetables
Vegetables, Fruits

我目前正在尝试分析上面显示的列的更大版本。本质上,客户报告了他们在市场上购买的东西,我正在尝试创建频率图。我尝试使用的代码如下所示:

fourth_question_viz <- ggplot(data=data_org, aes(market_purchases)) 
+ geom_bar(aes(fill=market_purchases)) 

包含多个对象(例如“肉类和家禽,蔬菜”)的响应会出现问题,而不是计算“肉类和家禽”的 1 个响应和“蔬菜”的 1 个响应,代码将其视为一个唯一值,例如“肉类和家禽,蔬菜” ”。

有没有办法可以修复 CSV 文件或添加代码来说明响应中的每个对象?

标签: rggplot2

解决方案


推荐阅读