python - 使用 python docx 查找文档的长度
问题描述
我正在尝试从 word 文档的第一行到最后一行进行循环。我正在使用 python-docx 包。文档也处理段落和表格。我想做的是:从文档的第一个到最后一个 for 循环,并为段落和表格做一些事情
如何遍历python中的每一行?
解决方案
将文件路径传递给以下函数:
import docx
def getText(filepath):
doc = docx.Document(filepath)
fullText = []
for para in doc.paragraphs:
fullText.append(para.text)
return '\n'.join(fullText)
它将返回您的行列表。(此处的行可能与您在文档中看到的行不同)
然后您可以使用以下方法进行迭代:
for paragraph in getText(filepath).split('\n'):
# do what you will with the line
推荐阅读
- python - Repeatedly check conditions inside loop or check up front but have two loops?
- ldap - CAS and LDAP custom integration
- javascript - 状态更新可能是异步的,this.props到底是什么?
- python - 防止重复的 Python 函数填充 RAM 空间
- esp32 - 无法打开 ESP32 设备上的 COM 端口。使用 Windows10 和 MPFShell
- postgresql - INSERT INTO 表 SELECT 与 COPY 的 PostgreSQL 性能
- mongodb - 如何在几个小时内复制一个 800GB 的 mongoDB?
- azure-sql-database - 我的公司要求直接从 Azure DW 进行转换和报告 - 这看起来是个好主意吗?
- typescript - 使用量角器水平滚动 Div
- c# - 访问 C# 类中的变量是否会从内存中读取整个类?