首页 > 解决方案 > Apache Solr:数据导入处理程序异常 - 在资源中找不到“gs”运算符的 SetGraphicsStateParameters 名称:/R7

问题描述

配置数据导入处理程序以处理批量 PDF 文档。处理 21000 份文件后。进程进入空闲状态,不处理所有文档。

当我看到下面观察到的日志时。

请让我知道无论如何我可以忽略此问题或我需要更新的任何设置。

 Error:

2020-04-23 18:39:55.749 INFO (qtp215219944-24) [ x:DMS] o.a.s.c.S.Request [DMS] webapp=/solr path=/dataimport params={indent=on&wt=json&command=status&_=1587664092295} status=0 QTime=0
2020-04-23 18:39:55.972 WARN (Thread-14) [ ] o.a.p.p.COSParser **The end of the stream is out of range, using workaround to read the stream, stream start position: 4748210, length: 2007324, expected end position: 6755534**
2020-04-23 18:39:55.976 WARN (Thread-14) [ ] o.a.p.p.COSParser Removed null object COSObject{50, 0} from pages dictionary
2020-04-23 18:39:55.976 WARN (Thread-14) [ ] o.a.p.p.COSParser Removed null object COSObject{60, 0} from pages dictionary
2020-04-23 18:39:55.997 ERROR (Thread-14) [ ] o.a.p.c.o.s.SetGraphicsStateParameters **name for 'gs' operator not found in resources: /R7**

字体 DDJQSL+Wingdings 中没有 198 (1) 的 Unicode 映射

问候,

拉维库马尔

标签: solrdataimporthandler

解决方案


分析文件后观察发现部分文件大小超过500mb。所以solr出现内存溢出异常,需要增加堆内存。做完之后这个问题就解决了。


推荐阅读