apache-spark - 从 hive 查询数据时 Spark 抛出 AnalysisException (org.apache.hadoop.hive.ql.metadata.HiveException: Invalid partition for table XXX)
问题描述
venv/lib/python3.6/site-packages/pyspark/sql/dataframe.py", line 438, in collect
[2021-07-25 19:02:38,600] INFO - Job: port = self._jdf.collectToPython()
[2021-07-25 19:02:38,600] INFO - Job: File "venv/lib/python3.6/site-packages/py4j/java_gateway.py", line 1143, in __call__
[2021-07-25 19:02:38,600] INFO - Job: answer, self.gateway_client, self.target_id, self.name)
[2021-07-25 19:02:38,600] INFO - Job: File "venv/lib/python3.6/site-packages/pyspark/sql/utils.py", line 69, in deco
[2021-07-25 19:02:38,600] INFO - Job: raise AnalysisException(s.split(': ', 1)[1], stackTrace)
[2021-07-25 19:02:38,600] INFO - Job: pyspark.sql.utils.AnalysisException: 'org.apache.hadoop.hive.ql.metadata.HiveException: Invalid partition for table digest_scheduler;'
无论如何,它可以通过在一段时间后重新运行相同的作业来解决。但想知道是什么导致了这个问题。
解决方案
推荐阅读
- javascript - React 无法在我的 KeyDown 事件中检测到“删除密钥”
- javascript - 未处理的拒绝(TypeError):已解析未定义并且在控制台中“未捕获(在承诺中)TypeError:已解析未定义”
- javascript - 列出本地存储数据
- python - 使用 ngrok 进行 Python 套接字服务器端口转发
- java - 一个场景的Java系统设计
- reflection - 为什么我在java中通过反射改变字符串s1常量,其他s2,s3也改变了?
- kubernetes - azure中的visual studio kubernetes项目503错误
- python - Python:无法将套接字数据作为邮件发送
- javascript - 将 javascript 模块导入 ASP.NET MVC 项目的问题
- python - python中两个值之间的差异