python - 有没有可能使用python从pdf中导出xml数据的方法
问题描述
我正在尝试像这种格式将 pdf 文件导出为 xml
<w:p>
<w:pPr>
<w:pStyle w:val="Heading5"/>
</w:pPr>
<w:bookmarkStart w:id="20" w:name="ssdfsdfd"/>
<w:r>
<w:t xml:space="preserve">Ssdfsdfd</w:t>
</w:r>
<w:bookmarkEnd w:id="20"/>
这样我就不会错过字体和图像。
解决方案
推荐阅读
- react-native - 两种颜色的背景 - React Native
- python - Pandas str.replace 跳过一些替换
- ansible - Ansible 标准输出格式
- docker - 弹性连接错误-> Elasticsearch 6 + Kibana + Docker Compose
- javascript - 如何连接此代码?我试过这样做,但我没有运气
- java - java用户界面调用python函数?
- mysql - MySql 服务不会启动 [ubuntu]
- javascript - 带撇号的正则表达式单词搜索
- excel - AVERAGEIF() 语句中的上限值
- tensorflow - Keras 的 CNN 培训冻结