python-3.x - 为什么我的多处理器程序不采用图像的整个路径?
问题描述
我一直在尝试在使用 tesseract 从图像中提取文本的程序上使用多处理。但是当我给我的图像命名时,它只在目录中搜索图像名称的第一个字母
def tess(all_clips):
img_text={}
start = timeit.default_timer()
image_dirs=[]
for a in all_clips:
image_dirs.append(Image.open('E:/fin_100_images/'+a))
num=0
for img in image_dirs:
df_temp = pytesseract.image_to_data(img,lang='mar',output_type='data.frame')
df_temp=df_temp.dropna().drop(['level', 'page_num', 'par_num', 'line_num', 'word_num','conf'],axis=1).reset_index().drop('index',1)
img_text[img] = df_temp.T.to_dict()
print('Total images done: '+str(num+1)+'\t Total images remaining: '+str(len(all_clips)-num-1)+' ',end='\r')
num=num+1
stop = timeit.default_timer()
df_temp = pd.DataFrame(list(img_text.items()), columns=['name', 'word_detail'])
print('Time: ', stop - start)
return df_temp
if __name__=='__main__':
all_clips = list(set([f for f in listdir('E:/fin_100_images/') if isfile(join('E:/fin_100_images/', f))]))
processes=[]
for i in all_clips:
process = Process(target=tess, args=(i,))
processes.append(process)
process.start()
for process in processes:
process.join()
print("Multiprocessing complete")
我收到以下错误
FileNotFoundError: [Errno 2] No such file or directory: 'E:/fin_100_images/l'
File "C:\ProgramData\Anaconda3\lib\multiprocessing\process.py", line 297, in _bootstrap
self.run()
File "C:\ProgramData\Anaconda3\lib\multiprocessing\process.py", line 99, in run
self._target(*self._args, **self._kwargs)
File "C:\Users\PRATHAMESH\Desktop\TEST_multi.py", line 28, in tess
image_dirs.append(Image.open('E:/fin_100_images/'+a))
File "C:\ProgramData\Anaconda3\lib\site-packages\PIL\Image.py", line 2770, in open
fp = builtins.open(filename, "rb")
解决方案
推荐阅读
- javascript - 如何处理 JavaScript 中的条件复选框选择?
- xcode - dyld:未找到符号:_OBJC_IVAR__$_NSTextViewIvars.sharedData
- python - 如何使用 Python 访问系统环境变量
- php - WordPress 中 WooCommerce API V2 URL 的 URL 重写不起作用
- c# - 将 System.Drawing.Color 转换为 int?
- python - Python - 如何将结果从 group by 传递给 Pivot?
- powershell - 生成 HMAC SHA256 签名 Powershell
- jodd - 使用 Joy 时如何设置 FileUploadFactory 的 maxFileSize?
- python - if 语句中的字典不起作用
- apache - ProxyPass 工作人员姓名(*此处为长网址*)太长