r - 使用 R 的 Haven 包正确处理导入到 R 的 SPSS .sav 文件中的 NA 值
问题描述
我的平台是Windows 10
我.sav
文件中的数据如下所示(截图来自PSPP
not SPSS
):
数据视图:
我haven
用来将.sav
文件导入R
:
library("tidyverse")
library("haven")
haven
命令(我的.sav
文件名是spss_missing99.sav
):
> spss2 <- read_sav("C:/.../spss_missing99.sav")
> spss2
# A tibble: 11 x 1
Points
<dbl>
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 NA
> is.na(spss2)
Points
[1,] FALSE
[2,] FALSE
[3,] FALSE
[4,] FALSE
[5,] FALSE
[6,] FALSE
[7,] FALSE
[8,] FALSE
[9,] FALSE
[10,] FALSE
[11,] TRUE
> mean(spss2)
[1] NA
Warning message:
In mean.default(spss2) : argument is not numeric or logical: returning NA
> mean(spss2, na.rm = TRUE)
[1] NA
Warning message:
In mean.default(spss2, na.rm = TRUE) :
argument is not numeric or logical: returning NA
我的问题:为什么最后两个mean
命令不起作用?
谢谢。
解决方案
因为您将数据框/小标题传递给mean
函数,mean
所以函数与向量一起使用。
mean(spss2$Points, na.rm = TRUE)
#[1] 5.5
您可以将数据框传递给colMeans
函数,该函数将返回数据框中所有列的列平均值。
colMeans(spss2, na.rm = TRUE)
#Points
# 5.5
推荐阅读
- python-3.x - 如何将secondary_y的线条与plotly express的默认y条对齐?
- vue.js - responsive-loader 只返回一个数据 url
- reactjs - 如何在打字稿中为领域对象中的可选字段声明类型?
- r - ggplot2中二分变量的镜像条形图在每边都有标签
- driver - 如何修改 NDIS 驱动程序以允许多个句柄绑定到特定接口?
- c++ - 如何在可见点和不可见点之间渲染线条?
- python - 从 python 到 C# 实现 linspace 以获取向量
- c - 为什么结果是 1
- python - Pandas 基于另一列滚动第二高值
- c# - 如何解析来自谷歌的图像并将它们显示到图片框中?