首页 > 解决方案 > 如何提取具有相互数据映射的美丽汤的标签?

问题描述

<ruling cchwin-doctype="ADMIN-DECISION" node-type="document" normval="20-1ARBP7587"
root="cch-internal-ref" sort-date="20200214"….>
<alias normval="richardvankalker" pub="arb" root="cch-internal-ref"/>
<alias normval="richard_vankalker" pub="arb" root="cch-internal-ref"/>
<heading align="left">Lewis County Rural Electric Cooperative Association and International
Brotherhood of Electrical Workers, Local Union Number 2.</heading>
<ruling-caption>
<ruling-citation-line>RICHARD VAN KALKER, Arbitrator. Selected by the parties. Hearing held 
in Canton, Missouri, May 8, 2019. Post-hearing briefs filed by June 21, 2019. Award issued 
on July 10, 2019.</ruling-citation-line>

我正在通过美丽的汤提取标签,但我无法使用正确的标签映射正确的数据。例如:- 我希望 normval 标记应该具有与 rule-citation-line 标记的映射,例如,如果制作 csv 文件输出应该是这样的:-

normval        ruling-citation-line
20-1ARBP7587     RICHARD VAN KALKER, Arbitrator

像 normval 应该具有上述裁定引用值

当我为每个标签分别提取数据然后转储到 csv 文件中时,我无法获得上述正确的映射数据。我真的被困在这个问题上。请帮助我该怎么做。

标签: pythonbeautifulsoupdata-extraction

解决方案


推荐阅读