spss - 如何计算文本实例
问题描述
我在 SPSS 中有一个电子邮件地址列表。我正在尝试编写语法来计算每个电子邮件地址出现的次数。
例如:
在我想要的输出中,如果 johndoe@aol.com 在数据中出现 3 次,我希望他的电子邮件的所有实例在我的新列中显示 3。
我知道我可以编写语法来计数(即 johndoe@aol.com 第一次将被分配 1,然后是 2,然后是 3)......但这不是我想要的。
谢谢!
解决方案
执行此操作的步骤:
- 通过电子邮件对案例进行排序。
- 使用聚合命令获取计数。
- 使用识别重复案例命令生成一个指示符,指示给定电子邮件是否是文件中同类电子邮件中的第一个。
- 选择不是该特定电子邮件的第一个案例。
所有这四个命令都在 GUI 的数据菜单中。完成整个事情的语法:
SORT CASES BY Email.
*This will create a new variable N_EMAIL with the counts. It will appear for every case.
AGGREGATE
/OUTFILE=* MODE=ADDVARIABLES
/PRESORTED
/BREAK=Email
/N_EMAIL=N.
*Now we generate a "PrimaryFirst" indicator showing whether a given case is the first instance of its email.
MATCH FILES
/FILE=*
/BY Email
/FIRST=PrimaryFirst
/LAST=PrimaryLast.
DO IF (PrimaryFirst).
COMPUTE MatchSequence=1-PrimaryLast.
ELSE.
COMPUTE MatchSequence=MatchSequence+1.
END IF.
LEAVE MatchSequence.
FORMATS MatchSequence (f7).
COMPUTE InDupGrp=MatchSequence>0.
SORT CASES InDupGrp(D).
MATCH FILES
/FILE=*
/DROP=PrimaryLast InDupGrp MatchSequence.
EXECUTE.
*Filter out duplicate cases.
SELECT IF PrimaryFirst = 1.
EXECUTE.
*Final cleanup.
DELETE VARIABLES PrimaryFirst.
推荐阅读
- excel - 如何合并行而不丢失excel中的数据
- vba - WinHttp.WinHttpRequest.5.1 URL 编码
- linux-kernel - 为什么 sys_futex 上的 kretprobe 调用频率低于相应的 kprobe?
- node.js - Puppeteer 无法识别链接
- python - 使用 super() 进行直接多重继承时保持可读性
- java - Android 我是否使用多个 ClassLoader/PathClassLoader?
- json - 请求参数 RefreshType 格式不正确
- java - 如果直接使用传递依赖,gradle build 会失败?
- python - 我不能在 python 3.x 中乘以数字
- sql - 是否可以将 SELECT ST_GeomFromText( 与其他 SELECT 一起使用?