python - Python Dask TypeError:无法解释'' 作为数据类型
问题描述
我正在尝试使用Dask
和GeoPandas
Geometry
输入。我执行以下操作:
sampel = dd.from_pandas(geo_data['geometry'], npartitions=5)
并得到一个dask.dataframe.core.Series
看起来像这样的:
path_id
252107318 LINESTRING (12813.000 10472.000, 13249.000 109...
252133674 LINESTRING (18662.000 103630.000, 17879.000 10...
252133710 LINESTRING (12374.000 103503.000, 12787.000 10...
252134520 LINESTRING (91560.000 102779.000, 91372.000 10...
252134720 LINESTRING (136141.000 105360.000, 136353.000 ...
Name: geometry, dtype: geometry
我尝试将其转换Linestrings
为JSON
文件,但是当我执行以下操作时:
sampel.map_partitions(lambda df: df.apply(lambda el: myfunc(el))).compute(scheduler='processes')
我收到错误消息TypeError: Cannot interpret '<geopandas.array.GeometryDtype object as a data type
。
有谁知道如何完成这项工作?还是不能使用Geometry
type in dask
?
谢谢 :)
解决方案
将 dask 与 GeoPandas 一起使用的最佳方法是dask-geopandas
处理数据类型和类似情况的项目。它仍处于早期开发阶段,但已经允许您使用 DataFrame 和几何图形。有关详细信息,请参阅https://github.com/jsignell/dask-geopandas。
推荐阅读
- google-chrome - 无法使用 MediaSource 在 Firefox 中重播 MP3,即使它在 Chrome 中工作
- r - 如何从R中列表中的循环中分配向量
- mysql - 查询中的问题以查找过去 xx 天内未对任何帖子发表评论的用户
- swiftui - 如何在父视图使用 IgnoringSafeArea() 时访问 safeArea 插图
- javascript - 为什么退出全屏模式后地址栏不显示?
- pandas - 计算列表中每个项目出现在 pandas 数据框列中的次数,用逗号分隔值
- css - 使用粘性标题制作整页滚动条控制表(仅限 CSS)
- java - 为什么 ArrayList 不插入一些值?
- r - 在 R 中将数字转换为日期时遇到问题
- java - 带有单个数据源的 SpringBoot + Batch + Cloud Task @EnableTask 注解导致“序列不存在”问题