首页 > 解决方案 > 具有重复值的 OpenRefine 拆分列

问题描述

我在 OpenRefine 中有一个列,如下所示:

Title
A Star is born
Author
George Cukor
Date
1954
Other tags...

每个项目的数据以标签名称(标题、作者、日期等)开头,后跟一个值,每个标签或值都在连续的行中,大约一万行。我希望有与标签一样多的列,与包含标题、日期、作者等的项目一样多的行,如下所示:

Title | Author | Date | etc.
A Star is born | George Cukor | 1954 | etc.

任何想法 ?谢谢

标签: openrefine

解决方案


这是您的原始数据集:

在此处输入图像描述

使用“转置 --> 将行中的单元格转置为列”(将选项 2 保留为默认值)。你会得到这个:

在此处输入图像描述

然后,在第一列上,应用“Transpose --> Columnize by key/value columns”并且不要更改那里的默认选项。最后结果:

在此处输入图像描述

这显然适用于更多标签/列,但前提是每个标签/列后跟一个值。


推荐阅读