首页 > 解决方案 > Python中的文本关联

问题描述

我正在分析一项包含“是”或“否”问题的调查。我想找到问题和答案之间最强的相关性。例如,如果有人对问题 1 回答“是”,那么他们也会对问题 2 回答“是”的相关性是什么?是否可以像将每个答案分配给一个数值 (0 + 1) 一样简单?我希望我已经说得够清楚了。

谢谢!

标签: python

解决方案


如果你想计算概率,我假设你有相当多的人参加了调查。您可以使用这些数据和简单的条件概率公式来获取您所寻找的信息。

假设 P(A) > 0 我们知道 P(B|A) = P(A ^ B) / P(A)

也就是说,给定 A 的 B 的概率等于 A 和 B 的概率超过 A 的概率。如果您的调查对象中有 10% 对问题 1 和问题 2 回答“是”(A ^ B),则 50%您的调查对象对问题 1 (A) 的回答为“是”,那么随机人对问题 2 的回答为“是”的概率(假设他们对问题 1 的回答为“是”) = .1/.5 = .2 或 20%。这一切都假设您确切知道有多少人对问题 1 回答“是”,以及有多少人对问题 1 和 2 都回答“是”。


推荐阅读