python - 如何将 Pandas DataFrame 转换为 RDF(资源描述框架)?
问题描述
我正在寻找在 Python 中将 Pandas DataFrames 转换为 RDF 数据的方法。我知道以下 Python 模块(我知道如何使用 Google!),但它们对我不起作用: rdfpandas pandasrdf 两者似乎都不成熟。我两个都有问题。在 rdfpandas 的情况下,我无法安装,并且没有示例且文档不足。对于 pandasrdf,该示例不起作用并崩溃。我可以修复它,但是 RDF 文件的三元组为零,所以结果没有用。我宁愿不必将数据写到一些我以后必须注入的中间数据文件中。我猜 Pandas->numpy->RDF 没问题。有没有人有一个将 Pandas DataFrame 转换为 RDF 的工作示例,其中一种常见的序列化格式不涉及手工黑魔法包安装?
解决方案
更新版本的 RdfPandas 已经发布,因此您可以尝试一下,看看它是否涵盖了您的用例:https ://rdfpandas.readthedocs.io/en/1.0.0/
import pandas as pd
import rdfpandas
df = pd.read_csv('investment_management_capabilities.csv', index_col = '@id', keep_default_na = True)
g = rdfpandas.to_graph(df)
ttl = g.serialize(format = 'turtle')
with open('investment_management_capabilities.ttl', 'wb') as file:
file.write(ttl)
进行转换的代码非常少,在这里(只需查看 to_graph 方法)https://github.com/cadmiumkitty/rdfpandas/blob/master/rdfpandas/graph.py,因此您可以直接将其用作创建自己的转换逻辑的灵感。
推荐阅读
- html - 显示带有空格和 JSX 的数组
- ios - SwiftUI:视图组合的代码重用
- oracle-apex - 如何在交互式报表中显示尾随空格
- c# - 如何处理 OData API 的不同可能数据请求的好方法是什么?
- git - Azure Devops - 在管道发布中创建新分支
- python - 列表中出现次数最多的元素
- c# - 如何将数据从控制器传递到后台服务
- bash - 将变量参数传递给 bash 函数
- excel - 使用 VBA-Web 将单元格值作为正文发送
- ios - 如何在 iOS 13 中将 UISegmentedControl 的 backgroundColor 设置为白色