r - 计算字母序列中的熵
问题描述
我正在尝试计算香农的字母序列熵,例如,
A <- c('A-A-A-A', 'A-B-C-D-E-E', 'A-B-D-F-G-E')
我正在尝试使用 TraMineR 方法来执行此操作,但由于我已经有一个 sequene 对象,因此无法使用 traMineR 包这样做,请参见下文:
http://traminer.unige.ch/doc/seqient.html
有什么建议么?谢谢
解决方案
也许:
library(TraMineR)
A<- c( 'A-A-A-A', 'A-B-C-D-E-E', 'A-B-D-F-G-E')
B <- as.data.frame(A)
actcal.seq <- seqdef(B)
## Summarize and plot histogram
## of within sequence entropy
actcal.ient <- seqient(actcal.seq)
summary(actcal.ient)
hist(actcal.seq)
更新:根据 OP 的要求,将熵添加到原始数据中:
cbind(B, actcal.ient)
# A Entropy
#[1] A-A-A-A 0.0000000
#[2] A-B-C-D-E-E 0.8020465
#[3] A-B-D-F-G-E 0.9207822
推荐阅读
- statistics - 注释者间协议的 Fleiss-kappa 分数
- c# - C#如何“删除”数组的第一个值,重新排序数组并将最后一个值设置回0?
- c# - C#泛型类继承混淆
- c# - 有什么方法可以在另一个带有视觉工作室的表单设计中使用?
- android - 静态字段会泄漏上下文
- angular5 - 'Uncaught SyntaxError: Unexpected token %' 将 jsonp 与 angular5 一起使用时的问题
- r - 如何使用另一列的值有条件地更改 DF 值
- java - 使用等待和通知时如何修复 IllegalMonitorStateException?
- r - R 中预算分配的优化(以前的 Excel Solver)
- api - 带有 API 网关的微服务 OAuth - 架构