stata - 我需要一些帮助
问题描述
我不太擅长STATA。我会在这里感谢您的帮助。我想知道数据集中的观察次数。其次,我想删除最后的观察结果。假设我有 100 个观察值,我想删除最后 10 个观察值。第三,我想创建一个假人,它应该采用“超重,如果 BMI>25 和 BMI<=30”的形式,我可以使用哪些代码?
解决方案
虽然我同意这个问题可以问得更好(请参阅此处的指南:https ://stackoverflow.com/help/how-to-ask ),但我仍然想帮助想要变得更好的人。
要获取数据集中的观察数,您可以使用命令count
。这显示了数据集中的观察次数。在许多情况下,您可以使用_N
在表达式中以编程方式表示观察数。
drop
您可以结合使用该命令in
来根据观察的排序顺序删除观察。drop in -10/l
(注意最后一个字符是小写 L)意味着从最后一个 obs 到最后一个(l 和最后一个)观察之间的第 10 个 obs 之间的所有观察都将被删除/删除。
一个 dummy 只接受 value 1
,0
或者丢失。您可以在 Stata 中使用标签1
来表示一些字符串,例如“Overweight”。无论如何,如果您有一个名为的数字变量,BMI
那么您可以创建您的虚拟变量,例如generate overweight = (BMI > 25 & BMI <= 30) if !missing(BMI)
. 如果丢失,该if !missing(BMI)
部分会使overweight
假人BMI
丢失。如果没有这部分,这与不超重的意思0
是不一样的,0
而缺失的意思是我们不知道这个人是否超重,这在认识论上是非常不同的。