tesseract - Tesseract tesstrain.sh 找不到字体
问题描述
我正在尝试使用以下指南训练 tesseract: https ://tesseract-ocr.github.io/tessdoc/TrainingTesseract-4.00.html
但即使我没有在命令行中输入字体参数,我也会收到此错误:找不到名为“Arial Bold”的字体。Pango 建议使用字体“Palatino”。请更正--font arg。错误:程序 text2image 失败。中止。
我找不到我在哪里犯错误?在此处输入图像描述
解决方案
所以我找到了解决方案:https://groups.google.com/forum/#!topic/tesseract-ocr/CpxTGGUlWIo
我列出了我想对其进行训练以获取其名称的字体:nour@nour:~$ text2image --fonts_dir path/to/fonts --list_available_fonts
然后我用字体名称编辑了:language-specific.sh,我将在上面训练 tesseract。
推荐阅读
- special-characters - 在 OxygenXML 中打开包含特殊字符的 DITA 文件时出现问题
- python - BeautifulSoup4 和请求模块'IndexError:列表索引超出范围'
- jquery - 如何从自制模态添加到购物车,而不重定向到产品页面?
- many-to-many - 是多哟还是一对多
- python - 如何使用 Python 遍历许多列以获取不是 NaN 的值
- latex - 表格填充宽度,每列 2 列作为多行
- python - 无法将日期解析为 datetime64[ns]
- javascript - 遍历打开和关闭库存头寸的数组/链
- google-apps-script - Google Apps 脚本从 google 目录获取信息
- react-native - 如何将来自 api 的布尔值切换为 true/false(React Native)?