python-3.x - 我正在尝试使用 Scrapy 抓取数据
问题描述
我正在尝试从 pewdiepie 频道获取所有视频链接。我写了下面的代码,它没有显示任何错误,但它没有抓取链接。
这是代码:
import scrapy
from scrapy.crawler import CrawlerProcess
class PewSpider(scrapy.Spider):
name = "pew_spider"
def start_request(self):
urls = ['https://www.youtube.com/user/PewDiePie/videos']
for url in urls:
yield scrapy.Request(url=url, callback=self.parser)
def parser(self, response):
links = response.css('div#contents > a#thumbnail::attr(href)')
filepath = "./Desktop/pew.csv"
with open(filepath, 'w') as f:
f.writelines( [link + '/n' for link in links])
process = CrawlerProcess()
process.crawl(PewSpider)
process.start()
解决方案
我想你应该先看看 YouTube API,然后再从网站上抓取它。https://developers.google.com/youtube/v3
推荐阅读
- php - 在 $in 条件下使用正则表达式将 mongodb 查询转换为 lumenEloquent
- php - xampp 中的网站图标
- c - 如何用 C 中的另一个数组替换数组中的所有匹配项
- python - Python:使用 Elasticsearch Scan 获得超过 10,000 个结果 ScanError
- c# - 从数据库中删除一条记录
- ios - 加载 Webview 时显示图像
- java - RecyclerView 在其他视图之上没有触摸事件(覆盖)
- python - 有效地在 python 列表中查找 nlargest 元素的索引
- pandas - 尝试在传递的数组中调试混合的日期时间和整数
- c# - Xamarin 形成新的解决方案启动