首页 > 解决方案 > 使用python从doc文件中获取大写/小写的特定单词?

问题描述

我得到以下输出:[[], [], ['Audi'], ['audi'], ['AuDi']]
但我希望['Audi','audi','AuDi']
我的代码是:

from docx import Document
document = Document(r'C:\Users\aliassample02.docx')
list1 = []
for para in document.paragraphs:
    results = re.findall(r'audi', para.text, re.IGNORECASE)
    list1.append(results)
print(list1)

标签: python

解决方案


改用extend列表append

list1 = []
for para in document.paragraphs:
    results = re.findall(r'audi', para.text, re.IGNORECASE)
    list1.extend(results)

或者您可以在列表理解中展平值:

list1 = [x for para in document.paragraphs 
           for x in re.findall(r'audi', para.text, re.IGNORECASE)]

编辑:

list1 = []
for para in document.paragraphs:
    for x in list2:
        results = re.findall(x, para.text, re.IGNORECASE)
        list1.extend(results)

推荐阅读