首页 > 解决方案 > 对数据集进行对应分析?

问题描述

我有下面的数据集来对其进行完整的分析,包括主成分分析、对应分析、多重对应分析。

https://archive.ics.uci.edu/ml/datasets/Tarvel+Review+Ratings

我在执行 CA 时发现了一些问题:

*首先了解数据集。我们知道 CA 用于分类变量,据我所知,在我的数据集中,只有一个分类变量是“来自欧洲 24 个类别的景点”。那么第二个分类变量可能是用户吗?

*另一个问题,使用下面的 R 代码使用 FactoMiner 包中的函数 ca() 执行 CA,它给了我以下错误:

代码 R:

library(FactoMineR)
data <- read.csv(file.choose(),row.names=1)
View(data)
data.active<-data[,0:24]
res.data <-CA(data.active,graph = FALSE)
summary(res.data,nb.dec = 2)

错误:

res.data <-CA(data.active,graph = FALSE) 特征错误(crossprod(t(X), t(X)), 对称 = TRUE) : 'x' 中的无限或缺失值

我不明白这可能是什么错误。当我读取数据集并将其放入“数据”变量中时,我发现另一个名为“X”的列在其所有单元格中具有 N/A 值。我不明白它来自哪里,所以我使用 R 代码中的“data.active”删除列“X”,然后我检查了 data.active 表是否包含任何 N/A 值,但它似乎是合法的 !!

所以任何人都可以帮助我解决这个问题,我将不胜感激。谢谢

标签: rdatasetpcacorrespondence-analysis

解决方案


推荐阅读