curl - 网页抓取 - 菜鸟
问题描述
我正在尝试从https://www.scimagojr.com网站中提取有关特定期刊的数据。尝试使用 curl 使用每个期刊 ID 提取数据。
例子:
在名为 data.txt 的 txt 中创建了一个 curl
Curl 'https://www.scimagojr.com/journalsearch.php?q=24589&tip=sid&clean=0'
Annales Zoologici Fennici Journal 的 ID 是 24589,但我在 url 中将其更改为 $1 以启用其他 ID 的使用,以便更轻松地收集数据
Curl 'https://www.scimagojr.com/journalsearch.php?q=$1&tip=sid&clean=0'
我尝试使用
./data.txt 24589
但它没有提供有关期刊的信息
解决方案
变量不在单引号内插值。改为双引号:
curl "https://www.scimagojr.com/journalsearch.php?q=$1&tip=sid&clean=0"
推荐阅读
- javascript - 如何解决错误:ENOENT:没有这样的文件或目录
- r - 为什么 rbind 在用户定义的函数中不起作用?
- javascript - Papaparse没有解析最后一个文件
- c++ - 基本数组功能难点
- powershell - 将多个文件名中每个单词的首字母大写(Powershell)
- git - ADo 存储库:推送被拒绝,因为提交包含与策略指定模式不匹配的作者电子邮件
- c++ - 关于 Stroustrup 的书例中模板的 value_type 使用问题
- css - 如何用css精确填充剩余的垂直空间
- svg - 如何根据 CSS 确定 SVG 元素的实际属性
- html - 可以将 Img srcset 转换为背景图像吗?