sql - 将两个 sql 查询合二为一,从 SEDE 的单个表中获取最流行的问题和答案
问题描述
我有一个查询,希望通过以下方式从SEDE中获取最受欢迎的问题
SELECT TOP 10
'https://stackoverflow.com/questions/' + CONVERT(VARCHAR, Posts.Id) as url,
(ViewCount / (SELECT - DATEDIFF(DAY, GETDATE(), CreationDate))) AS ave_views_per_day,
Body as QUESTION,
Posts.Id,
Title
FROM
Posts
LEFT JOIN
PostTags ON Posts.Id = PostTags.PostId
LEFT JOIN
Tags ON PostTags.TagId = Tags.Id
WHERE
TagName IN ('##tag##')
AND ViewCount > 10000
ORDER BY
ave_views_per_day DESC
我有一个额外的查询来获得给定问题 ID 的最高得分答案:
SELECT
'https://stackoverflow.com/questions/' + CONVERT(VARCHAR, Id) as url, HighestScoringAnswer
FROM
(SELECT TOP 1
Id, Body AS HighestScoringAnswer,
DENSE_RANK() OVER (ORDER BY Score DESC) Rank
FROM
(SELECT p.Id, p.ParentId, p.Body, p.Score
FROM Posts p
WHERE p.ParentId = ##QuestionId##) x
ORDER BY
Rank ASC) x
如何组合这些查询,以便##QuestionId##
第二个查询的来源来自Posts.Id
第一个查询,并将结果HighestScoringAnswer
列添加到第一个查询的结果中?我尝试使用该Union
操作,但无法弄清楚如何将 Id 从一个查询“传递”到另一个查询。
解决方案
您必须JOIN
在两个查询(问题和答案)之间进行选择;不是UNION
(UNION
返回第一个查询的行加上第二个查询的行,不包括重复的行;但您想要前十个问题以及同一行中每个问题的得分更高的答案)。
试试这个查询,我认为这是您要查找的查询:
SELECT DISTINCT TOP 10
'https://stackoverflow.com/questions/' + CONVERT(VARCHAR, q.Id) as url,
(q.ViewCount / -DATEDIFF(DAY, GETDATE(), q.CreationDate)) AS ave_views_per_day,
q.Body as QUESTION,
q.Id,
q.Title,
FIRST_VALUE(a.Body) OVER (PARTITION BY q.id ORDER BY a.Score DESC) AS HighestScoringAnswer
FROM Posts q
LEFT JOIN Posts a ON q.id = a.ParentId
WHERE q.PostTypeId = 1
AND q.Tags LIKE '%postgresql%'
AND q.ViewCount > 10000
ORDER BY ave_views_per_day DESC;
推荐阅读
- python - 如何在执行 test.py 时解决此错误?
- python - 从字符串访问文本
- wordpress - Displaying product category names in the WordPress order table (Woocommerce)
- java - 编写 Java scriptlet 时找不到 java.util.Date
- rust - 如何在匹配臂中表达变量类型?
- azure-devops - 如何使用 Azure devops 中的 Rest API 从提交中获取文件,不包括 PullRequest 中的合并提交
- swift - 视频不会在 swift 中的给定视图中全屏播放。需要帮助修复它
- google-cloud-platform - 如何使用变量在 terraform GCP 上添加或删除 access_config
- parsing - 从 EDGAR 接收带有请求的数据(错误 403)
- java - 为什么 Spring Quart Scheduler Job 运行的间隔比预期的要长