首页 > 解决方案 > 使用 Python 在 Excel 工作表中查找带下划线的单词

问题描述

是否可以通过 excel 中的两列(假设列 C 和 D)搜索/解析并使用 python 仅查找带下划线的字段?也许像这样的代码?不太确定..:

Import xl.range 
Columns = workbook.get("C:D"))
Extract = re.findall(r'\(._?)\', str(Columns)

如果我的代码可以进一步改进,请告诉我!:)

标签: pythonexcelpython-3.x

解决方案


是的,这确实是可能的。您将获得的主要库是pandas. 当然,在安装 python 之后,安装它(此处的说明),您可以按照以下方式进行操作

import pandas as pd

# Reading the Excel worksheet into a pandas.DataFrame type object
sheet_path = 'C:\\Path\\to\\excel\\sheet.xlsx'
df = pd.read_excel(sheet_path)

# Using multiple conditions to find column substring within
underscored = df[(df['C'].str.contains('_')) | (df['D'].str.contains('_'))]

这对于列CD工作表中的内容都是如此。

pandas有一个非常多样化的文档,但在您正在寻找的范围内,read_excel函数文档(有示例)就足够了,如果需要的话,还有一些关于 python 本身的更多内容。


推荐阅读