google-bigquery - 从结果表中删除不相关的数据 - 已编辑
问题描述
我使用了一个文章数据库来检查哪十个人被提及最多。但有些结果是无关紧要的。我在一个结果上使用了以下代码 - 它起作用了 - 不相关的结果被删除了。
person,
COUNT(1) AS count_mentions,
COUNT(DISTINCT url) AS count_distinct_urls
FROM
`myproject.mytable.schema`
WHERE lower(PERSON) not like '%irrelevant_results1%'
GROUP BY
person
ORDER BY
count_mentions DESC
LIMIT
10;
但是当我想用它来删除所有其他不相关的结果时——它没有用,它只删除了前两个不相关的结果,而不是第三个不相关的结果。
你能帮我找出问题所在吗?
谢谢你们!
SELECT
person,
COUNT(1) AS count_mentions,
COUNT(DISTINCT url) AS count_distinct_urls
FROM
`myproject.mytable.schema`
WHERE
(lower(PERSON) not like '%irrelevant_results1%' and
lower(PERSON) not like '%irrelevant_results2%' and
lower(PERSON) not like '%irrelevant_results3%' )
GROUP BY
person
ORDER BY
count_mentions DESC
LIMIT
10;
解决方案
推荐阅读
- spring-boot - @Group 注释中的 minOccurs 属性导致 UnexpectedRecordException
- c# - 如何从字节数组返回pdf
- android - Google Play 游戏登录失败
- xslt - XSLT - 使用 xml:when 时无法从节点获取数据
- android-testing - 如何在 Espresso 测试中重新启动 Android 应用程序(/应用程序状态)?
- makefile - 根据构建矩阵构建目标
- angular - Angular 2 到 4/5/6:升级前需要了解/做/检查哪些事情?
- hyperledger-fabric - 如何使用 Hyperledger Fabric 部署链码?
- angular - Lodash omit not working after angular migration to 6
- ruby-on-rails-5 - 在 Rails 5 中递归渲染部分视图