python - Python 中的 Google 自定义搜索 (CSE) API 使用文本文件中的多个查询关键字询问 24,000 个查询
问题描述
首先,我将永远感谢任何可以为此提供帮助的人。我正在尝试使用 Python 以相对复杂的方式查询整个网络的 Google 自定义搜索 API。我已成功查询 API 以获取一个短语查询,并且我了解如何更改域、语言等。
但我想做的是寻找;
PepsiCo 丑闻,返回 10 页结果,用于google.de域
然后
PepsiCo 丑闻,返回 10 页结果,用于google.co.uk域
PepsiCo 丑闻,返回 10 页结果,用于google.com域
等等覆盖所有30个国家域
然后是第二个搜索词、十页结果和三十个不同的国家/地区域。
三星丑闻,返回 10 页结果,用于google.de域
然后
三星丑闻,返回 10 页结果,用于google.co.uk 域
三星丑闻,返回 10 页结果,用于google.com域
依此类推,涵盖所有 30 个国家/地区的域。
我想通过这个循环运行 80 个搜索短语,但我不知道如何实现这一点。我对 Python 很陌生,我了解一些概念,但我在将它们实际实现到适用于此用例的脚本中时却失败了。同样,任何帮助都将不胜感激。
搜索词 - 80 个
谷歌国家域 -
每个查询 30 页结果 - 10
总查询 - 24,000
我知道我必须付费才能运行这么多 API 查询。这是一次性的搜索。再次感谢!下面是基本代码,我没有添加任何我一直在试验的废话代码,这只会使问题复杂化!
import pprint
from googleapiclient.discovery import build
def main():
service = build("customsearch", "v1",
developerKey="key")
res = service.cse().list(
q='Pepsico + Scandal',
cx='search engine ID',
cr="countryUK",
lr="lang_en"
).execute()
pprint.pprint(res)
if __name__ == '__main__':
main()
解决方案
推荐阅读
- python - 将简单的 Python 请求 POST 转换为 Rust reqwest
- flutter - VSCode 中是否有用于键入时显示的快速文档的设置?
- transactions - EF Core 在事务中创建一个新的独立事务
- python - 使用仿射变换翻转时,简单的 itk 行为不符合预期
- python - Python:字典在调用条目时无限循环代码
- c++ - 来自 std::pair rvalues 构造函数的垃圾值
- python - 如何在 Python 中将输出从秒转换为 hhmmss
- yup - 是的验证中的对象数组不起作用
- leaflet - 如何使用角度的传单地图将角度90的圆弧放置在半径5公里的圆内以及如何更改圆的颜色
- android - 指定 Kotlin 泛型允许的一组有限类型