shell - 使用 wkhtmltopdf 拉取单个页面
问题描述
我正在尝试将 HTML 页面转换为文档,但它们都在单独的页面上,例如
http://www.website.co.uk/example/html5forwebkit.html?page=32
如果我运行标准命令,我只得到一页,是否有一个快捷命令可以拉出我需要的每一页?有 450 页,我希望它们都在同一个 PDF 文件中
解决方案
您可以做的是创建一个循环并使用每个页面制作一个 PDF,wkhtmltopdf
然后使用 .将这些单独的 PDF 合并在一起pdfunite
。
# Change the values to your liking
# ↓ ↓↓↓
for page in {1..450};do
wkhtmltopdf "http://www.website.co.uk/example/html5forwebkit.html?page=$page" page_$page.pdf
# Optional 'sleep' so that you dont end up DOSing the site
sleep 0.5
done
# Merge the PDFs into one
pdfunite page_*.pdf out.pdf
推荐阅读
- cross-platform - Cross Platform solution
- javascript - Play Video by trigger('play') for 1
- azure-data-factory-2 - Migrate ADF - Datasets which are linked with Linked Services and Pipelines to Synapse Analytics
- r - 如何在 ggplot 的多面饼图上正确放置标签?
- android - Unhandled Exception: Could not find a generator for route RouteSettings("/CatPage", null) in the _WidgetsAppState
- amazon-web-services - How can I use AWS EBS Volumes with bare metal Kubernetes
- r - Function that accepts factor and numerical inputs
- javascript - 谷歌表格脚本获取单元格超链接
- typescript - 是否可以在从回调和参数列表中创建承诺的函数上创建类型安全?
- java - 在android studio中找不到本机方法的实现