首页 > 解决方案 > Python 中的 Google 自定义搜索 (CSE) API 使用文本文件中的多个查询关键字询问 24,000 个查询

问题描述

首先,我将永远感谢任何可以为此提供帮助的人。我正在尝试使用 Python 以相对复杂的方式查询整个网络的 Google 自定义搜索 API。我已成功查询 API 以获取一个短语查询,并且我了解如何更改域、语言等。

但我想做的是寻找;

PepsiCo 丑闻,返回 10 页结果,用于google.de

然后

PepsiCo 丑闻,返回 10 页结果,用于google.co.uk

PepsiCo 丑闻,返回 10 页结果,用于google.com

等等覆盖所有30个国家域

然后是第二个搜索词、十页结果和三十个不同的国家/地区域。

三星丑闻,返回 10 页结果,用于google.de

然后

三星丑闻,返回 10 页结果,用于google.co.uk

三星丑闻,返回 10 页结果,用于google.com

依此类推,涵盖所有 30 个国家/地区的域。

我想通过这个循环运行 80 个搜索短语,但我不知道如何实现这一点。我对 Python 很陌生,我了解一些概念,但我在将它们实际实现到适用于此用例的脚本中时却失败了。同样,任何帮助都将不胜感激。

搜索词 - 80 个
谷歌国家域 -
每个查询 30 页结果 - 10
总查询 - 24,000

我知道我必须付费才能运行这么多 API 查询。这是一次性的搜索。再次感谢!下面是基本代码,我没有添加任何我一直在试验的废话代码,这只会使问题复杂化!

import pprint
from googleapiclient.discovery import build

def main():

    service = build("customsearch", "v1",
        developerKey="key")

    res = service.cse().list(

        q='Pepsico + Scandal',

        cx='search engine ID',

        cr="countryUK",

        lr="lang_en"

    ).execute()

pprint.pprint(res)

if __name__ == '__main__':
    main()

标签: pythongoogle-apigoogle-custom-search

解决方案


推荐阅读