python - 限制报纸的 URL 输出
问题描述
我正在使用报纸 3 从 news.google 中提取 URL,但问题是我不断获取所有 URL(我已禁用 memoize,因为我需要完整列表)。我只想打印前 5 个链接或 5 个随机链接并不重要。我试过设置最大值,但没有奏效。有任何想法吗?
import newspaper
news = newspaper.build('https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pWVXlnQVAB?oc=3&ceid=US:en', memoize_articles=False)
for article in news.articles:
print(article.url)
解决方案
此代码段应该正是您想要的。它不使用报纸功能,而是随机选择一定数量的网址。报纸的输出不是列表,因此必须使用 append 函数将其转换为列表。享受!
import newspaper
business_news = newspaper.build('https://news.google.com/topics/CAAqJggKIiBDQkFTRWdvSUwyMHZNRGx6TVdZU0FtVnVHZ0pWVXlnQVAB?hl=en-US&gl=US&ceid=US%3Aen', language='en', memoize_articles = False)
myList = []
for article in business_news.articles:
myList.append(str(article.url))
print(myList) #not necessary just for display purposes
import random
aselect = myList
randarticles = random.sample(aselect, 5)
print(randarticles)
推荐阅读
- amazon-web-services - AWS ec2 RequestSpotInstances - InvalidSubnetID.NotFound 在传递逗号分隔的子网 ID 时
- ros - 为什么不是所有五个防水 JSN-SR04T 超声波距离传感器都将 ping 传送到 ROS Noetic?
- python - Python中如何将YOLO格式注解转换为x1,y1,x2,y2坐标?
- python - SikuliLibrary 图像识别功能在 Windows 上不起作用
- node.js - Visual Studio 构建 njsproj Node.js 项目,即使自上次构建以来没有任何更改
- javascript - RxJs:当全部取消订阅时,中止延迟和共享的 observable
- javascript - 让引导程序使用 gridstack 小部件大小来调整大小?
- c# - 当输入记录数 > 1000 条记录时有效调用 GetByIds(MS Graph API 方法)
- azure - 从数据存储区加载 Azure ML 试验运行信息
- java - 如何更改/刷新 maven project.basedir 属性?