首页 > 解决方案 > 从 EAN/UPC 谷歌搜索中排名第一的网站抓取数据

问题描述

我很好奇以下自动化是否可行:

  1. 在Google 上搜索UCP /EAN 代码(例如8710103703631
  2. 从与Product相关的第一个排名页面中抓取和解析数据(取决于可用的数据):
    • 姓名
    • 模型
    • 图片
    • 描述

只是想了解这可能有多复杂。

谢谢!

标签: web-scrapingproductbarcodeinformation-retrievalinformation-extraction

解决方案


通过 API 查找 EAN/UPC 代码

有一些免费的网络 API(反向)查找条形码 (EAN/UPC) 或提供附加信息。

例如ean-search.org是一个由 EAN 查询并提供 XML 的 REST API(例如,为您的示例“Philips Sonicare”提供到 Amazon 的链接)。

使用 API 的好处:即用型数据,无需抓取。

网络抓取搜索结果

当然,您可以使用搜索引擎(如 google、duckduckgo 等)并使用最喜欢的网络抓取以您所需的编程语言搜索条形码:


推荐阅读