首页 > 解决方案 > python提取具有给定正则表达式格式的文件

问题描述

我试图提取包含 EOB_FILE 的文件

例如我有类似的东西

s = "path Omega/CC/Pune/SYNTT/EOB_PROCESSED_BY_OCR/EOB_FILE/0A225618045646F2AEEFC23E74CAC253/0A225618045646F2AEEFC23E74CAC253_page1.json"

我怎样才能只得到文件名0A225618045646F2AEEFC23E74CAC253_page1.json

我试过的代码:

val = re.findall(r'([^.]*EOB_FILE[^.]*)', s)
val
['path Omega/CC/Pune/SYNTT/EOB_PROCESSED_BY_OCR/EOB_FILE/0A225618045646F2AEEFC23E74CAC253/0A225618045646F2AEEFC23E74CAC253_page1']

预期输出:

0A225618045646F2AEEFC23E74CAC253_page1.json

标签: pythonregex

解决方案


import os
s = "path Omega/CC/Pune/SYNTT/EOB_PROCESSED_BY_OCR/EOB_FILE/0A225618045646F2AEEFC23E74CAC253/0A225618045646F2AEEFC23E74CAC253_page1.json"

os.path.basename(s)

os 是 python 杂项操作系统接口。在此处查看文档


推荐阅读