python - 使用 Python 将包括表格在内的整个 Word 文档复制到另一个文档
问题描述
我需要将模板的全部内容复制到新文档中。问题是表格不能被复制。目前,我的代码负责复制粗体和斜体等样式。
def get_para_data(output_doc_name, paragraph):
output_para = output_doc_name.add_paragraph()
for run in paragraph.runs:
output_run = output_para.add_run(run.text)
# Run's bold data
output_run.bold = run.bold
# Run's italic data
output_run.italic = run.italic
# Run's underline data
output_run.underline = run.underline
# Run's color data
output_run.font.color.rgb = run.font.color.rgb
# Run's font data
output_run.style.name = run.style.name
# Paragraph's alignment data
output_para.paragraph_format.alignment =
paragraph.paragraph_format.alignment
input_doc=Document('templatemain.docx')
output_doc=Document()
for para in input_doc.paragraphs:
get_para_data(output_doc, para)
output_doc.save('OutputDoc.docx')
我为复制表找到的大部分帮助是附加它们。但是我将模板复制到空白文档中,所以这对我没有任何帮助。
解决方案
您只是在迭代.paragraphs
文档的属性。.tables
表格通过属性单独列出。
您需要按文档顺序循环遍历文档正文的所有子元素,否则您最终会将所有段落和表格捆绑在一起。该python-docx
库不直接提供此功能,您需要创建自己的 iterator。
例如,简化版本将是:
from docx.oxml.text.paragraph import CT_P
from docx.oxml.table import CT_Tbl
from docx.table import Table
from docx.text.paragraph import Paragraph
# select only paragraphs or table nodes
for child in input_doc.element.body.xpath('w:p | w:tbl'):
if isinstance(child, CT_P):
paragraph = Paragraph(child, input_doc)
get_para_data(output_doc, paragraph)
elif isinstance(child, CT_Tbl):
table = Table(child, input_doc)
# do something with the table
表格只能包含在文档正文、表格单元格(因此嵌套在其他表格中)、页眉和页脚、脚注和跟踪更改中,但不能包含在段落中。
推荐阅读
- php - 如何将 php 数组打印到 HTML 表中
- javascript - Chart.js 为大型数据集呈现黑屏
- javascript - 如何使用 Nextjs 设置 Firebase 托管多站点
- python-3.x - 无效的语法打印 Python
- java - 我无法继续执行任务
- python - 无法连接到端点 URL:“http://127.0.0.1:8000/”
- powershell - 将文件复制到其父目录,并以目录名称为前缀
- sql - 我想在我现有的 hive 表中添加一个额外的列,以便我可以获得当天的当前时间戳
- mysql - 如何将多个数据库添加到一个 Presto 目录?
- sql-server - object_id 返回 null 具有最少权限的 sql 身份验证用户