首页 > 解决方案 > 寻找方向以建立在线网络爬虫数据库

问题描述

我想开始用 python 编码以建立一个在线数据库。更具体地说,我想运行一个从其他站点(显然提供共享内容的站点)抓取数据的站点,以集中信息。

我以前涉足过编码,对编程语言有初步的了解,所以我很好地弄清楚了如何学习变量、类等。我感到困惑的是这一切的概念化以及如何实现它。也许我可以概述一下我个人的想法,你们可以告诉我这是否有意义:

我想托管一个网站,该网站运行类似 django 的东西,因此可以执行 python 脚本或从其他网站收集信息的应用程序,删除重要信息,然后整齐有序地显示。这还应该涉及一个可搜索的数据库。现在,这是我需要 SQL 的东西吗?或任何其他数据库编程语言?我以前从未使用过数据库。我还想提供建议选项,以便在您输入一个术语时提供建议。

那么,包含 HTML、CSS 和 JS 的网站代码,然后是运行 python 的 django 框架,然后...... SQL?我希望这是有道理的,至少这是我现在正在考虑的。

我很高兴收到你们的来信,我是否在这里以正确的方式思考。另外,如果您能指出合适的资源,我将非常高兴。我自己搜索了一下,偶然发现了 Automate The Boring Stuff 之类的东西,但到目前为止,这并不真正适合我想要做的事情的范围。无论如何,提前感谢您的任何回复!:)

标签: pythondatabaseweb-scraping

解决方案


你可以订阅 PythonWeekly。他们每隔一段时间就有关于用 python 抓取的文章。

参见例如: https ://rrighart.github.io/Webscraping/


推荐阅读