python - 使用 twint 按 ID 获取推文文本
问题描述
我有一个存储在 csv 文件中的推文 ID 列表,我想获取每个 ID 的文本内容,然后将其与推文 ID 一起保存在 csv 文件中。这是我的代码,但它不起作用,它不返回任何结果。
def scrape_tweets(search_ids):
# Configure
for i in range(len(search_ids)):
c = twint.Config()
c.Custom["tweet"] = [search_ids[i]]
c.Store_csv = True
c.Output = os.path.join('../data_csv/{}.csv'.format(search_ids[i]))
twint.run.Search(c)
search_ids = ['1221875106206638080','1221883443467952128'] # an example for ids list
scrape_tweets(search_ids)
运行代码时出现此错误:
CRITICAL:root:twint.run:Twint:Feed:noDataExpecting value: line 1 column 1 (char 0)
sleeping for 1.0 secs
CRITICAL:root:twint.run:Twint:Feed:noDataExpecting value: line 1 column 1 (char 0)
sleeping for 8.0 secs
CRITICAL:root:twint.run:Twint:Feed:noDataExpecting value: line 1 column 1 (char 0)
sleeping for 27.0 secs
CRITICAL:root:twint.run:Twint:Feed:noDataExpecting value: line 1 column 1 (char 0)
sleeping for 64.0 secs
CRITICAL:root:twint.run:Twint:Feed:noDataExpecting value: line 1 column 1 (char 0)
解决方案
请在 twint 的 github 问题页面中查看类似问题。显然,twitter 删除了从中获取推文的端点,因此超时。错误。该解决方案对我有用。
推荐阅读
- mysql - 如何在 Baikal/SabreDAV 上实现加密?
- javascript - 为什么我的 Javascript 过滤器只显示第一行
- latex - 投影仪子列表中的多种类型的项目符号列表
- python - TypeError:“元组”和“浮点”的实例之间不支持“>”
- python - 使用 BrowserMob 时如何解决 (500, None) 错误?
- php - 修改内容后如何包含存储在变量中的 PHP 文件的内容?
- c++ - 更改tasks.json后VS代码删除文件
- c - 传递 'fgets' 的参数 1 使指针来自 int 而不进行强制转换
- docker - Ping 或 SSH 连接到 docker 容器时出现问题
- assembly - Nasm“指令预期”问题是我的编译器还是我的代码