solr - Apache Solr:数据导入处理程序异常 - 在资源中找不到“gs”运算符的 SetGraphicsStateParameters 名称:/R7
问题描述
配置数据导入处理程序以处理批量 PDF 文档。处理 21000 份文件后。进程进入空闲状态,不处理所有文档。
当我看到下面观察到的日志时。
请让我知道无论如何我可以忽略此问题或我需要更新的任何设置。
Error:
2020-04-23 18:39:55.749 INFO (qtp215219944-24) [ x:DMS] o.a.s.c.S.Request [DMS] webapp=/solr path=/dataimport params={indent=on&wt=json&command=status&_=1587664092295} status=0 QTime=0
2020-04-23 18:39:55.972 WARN (Thread-14) [ ] o.a.p.p.COSParser **The end of the stream is out of range, using workaround to read the stream, stream start position: 4748210, length: 2007324, expected end position: 6755534**
2020-04-23 18:39:55.976 WARN (Thread-14) [ ] o.a.p.p.COSParser Removed null object COSObject{50, 0} from pages dictionary
2020-04-23 18:39:55.976 WARN (Thread-14) [ ] o.a.p.p.COSParser Removed null object COSObject{60, 0} from pages dictionary
2020-04-23 18:39:55.997 ERROR (Thread-14) [ ] o.a.p.c.o.s.SetGraphicsStateParameters **name for 'gs' operator not found in resources: /R7**
字体 DDJQSL+Wingdings 中没有 198 (1) 的 Unicode 映射
问候,
拉维库马尔
解决方案
分析文件后观察发现部分文件大小超过500mb。所以solr出现内存溢出异常,需要增加堆内存。做完之后这个问题就解决了。
推荐阅读
- json - Openlayers & NPM:无法加载本地 .json 文件
- javascript - Angular Material Datepicker如何将月份标签从格式MMM设置为格式MMMM(长)
- php - 从 PHP MySql 访问 $http.post 请求中的 JSON 数据
- python - Sympy 中的 Steinhart-Hart 热敏电阻校准
- python - 如何将 Stellarium 生成的文件的二进制编码文件转换为 ASCII
- django - 将查询集转换为字符串
- java - 考虑到性能、反射或构造函数引用,哪个是实例化 java 类的更好方法?
- regex - 提取器正则表达式中的正则表达式问题 - JMeter
- mysql - 创建 BEFORE INSERT 触发器时出现模棱两可的错误
- r - 混合 S3 和 S4 时的方法调度