首页 > 解决方案 > 谷歌表格从多行和多列中提取特定数据以放入逻辑回归函数

问题描述

我有一个多年学生年度写作评估分数的电子表格。

每行是一个测试的数据(测试年份、学生 ID、带有小节的测试分数等)。

我需要将每个学生的数据填充到一个逻辑回归模型中,其中包含以下变量:

SUMPRODUCT FUNCTION 我需要显示所选数据的位置:

逻辑回归函数所需的电子表格和相应的单元格

B 常数 Y3 -16.266 [生成一个数字“1”来平衡 sumproduct 函数。]

B T1AvgScore 0.911 【学生一年级考试平均分】我需要一个函数把数据放在这里

B T3AvgScore 2.399【学生三年级考试平均分】我需要一个函数把数据放在这里

B T3SF2 0.434 [学生三年级'句子流畅度(SF)'分数] 我需要一个函数来把数据放在这里

B T3Conv2 0.251 [学生三年级'Conventions (Conv)' 分数] 我需要一个函数来把数据放在这里

y* = ln(p/(1-p)) [根据上述 sumproduct 函数计算]

p = exp(y*)/(exp(y*)+1 [预测百分比的计算]

提前感谢您的任何帮助!

标签: google-sheetslogistic-regression

解决方案


好吧,我不清楚我是否在回答您要查找的内容,但是我有公式可以从给定学生编号的 AWA 表中提取平均分数值。请参阅我添加到您的工作表中的选项卡,Example-GK。

查询公式很简单:

=query(AWA,"select F where A = "&E$15&" and B = '"&D19&"' ",0)

其中 15 是指定的 StudentID(一个数值,因此不使用单引号),D19 是特定年份。

我还添加了从下拉列表中选择学生 ID 号的功能,在该表的 E15 中。或者,如果StudentID 可用且更易于使用,则可以使用StudentName 代替StudentID 作为选择标准。目前,StudentName 被忽略,因为它在数据中不可用。

让我知道这是否是您正在寻找的。一个问题是某些学生可能有更多年的数据。还有其他列出年份的方法,这可能会对您有所帮助。我会看看我是否可以添加该功能。

2020 年 9 月 9 日更新:

如果我正确理解了您的评论,并且对于每个模型,都有一组适用于所有学生的常量(请参阅下面的模型 3 常量),那么我可能有一组通用的公式来计算概率每个学生都使用所有三个模型,前提是该学生有足够的数据。

在此处输入图像描述

在您的工作表中查看我更新的 Example-GK。如果我仍然不明白您的最终概率是如何从个别学生数据值计算出来的,请告诉我。


推荐阅读