python - Python中的文本关联
问题描述
我正在分析一项包含“是”或“否”问题的调查。我想找到问题和答案之间最强的相关性。例如,如果有人对问题 1 回答“是”,那么他们也会对问题 2 回答“是”的相关性是什么?是否可以像将每个答案分配给一个数值 (0 + 1) 一样简单?我希望我已经说得够清楚了。
谢谢!
解决方案
如果你想计算概率,我假设你有相当多的人参加了调查。您可以使用这些数据和简单的条件概率公式来获取您所寻找的信息。
假设 P(A) > 0 我们知道 P(B|A) = P(A ^ B) / P(A)
也就是说,给定 A 的 B 的概率等于 A 和 B 的概率超过 A 的概率。如果您的调查对象中有 10% 对问题 1 和问题 2 回答“是”(A ^ B),则 50%您的调查对象对问题 1 (A) 的回答为“是”,那么随机人对问题 2 的回答为“是”的概率(假设他们对问题 1 的回答为“是”) = .1/.5 = .2 或 20%。这一切都假设您确切知道有多少人对问题 1 回答“是”,以及有多少人对问题 1 和 2 都回答“是”。
推荐阅读
- asp.net-mvc - 在实体框架中的两个类之间创建一对一关系时出错
- node.js - 将标头发送到客户端后无法设置标头-保存到 MongoDb 的条目-Express.Js
- api - Podio Api:为什么 PUT 请求 /app/{app_id}/field/{field_id} 删除联系人应用的类别字段选项?
- maximo - 结果集 BAR 图表 order by(sorting)
- sql - 如何改进代码以包含另一个表中的列?
- javascript - 将单词转换为链接并在 html 中替换它们
- css - Flexbox 垂直内容与 Internet Explorer 中的溢出对齐
- swift - 无法在 URLSession 线程之外存储值
- python-3.x - 将 .sav 文件转换为 pandas 数据框
- angular - 在 Angular 和 Identity Server 4 中使用 PKCE 进行 OIDC 连接和验证代码流