xml - 努力将 Powershell XML 转换为 CSV
问题描述
我正在尝试将 XML 文件转换为 CSV。虽然这里的问题很有用,但我无法将这些建议应用于我的案例 - 大概是因为我的实体是多值的。我的 Xml 看起来像:
<?xml version="1.0" encoding="UTF-8">
<ReportOutput Version="1">
<ReportFilters>
<Filter Name="Report Name" Value="My report"/>
<Filter Name="Path" Value="/">
<Filter Name="attr1" Value="*">
...
</ReportFilters>
<ReportHeader>
<columnHeader>attr1</columnheader>
<columnHeader>attr2</columnheader>
<columnHeader>attr3</columnheader>
...
</ReportHeader>
<ReportRecord>
<item>1</item>
<item>first</item>
<item>A</item>
...
</ReportRecord>
<ReportRecord>
<item>2</item
<item>second</item>
<item>B</item>
...
</ReportRecord>
...
</ReportOutput>
(where '...' represents one or recurrences of the previous node pattern)
XML 只是一个简单的包装器,它本质上是一个表格数据集——ReportHeader 和 ReportRecord 节点都包含相同数量的子节点。
我想要 CSV 文件中的 ReportHeader.columnHeaders 和 ReportRecord.Items:
attr1, attr2, attr3 ...
1, first, A ...
2, second, B ...
我可以ReportFilters
很容易地删除:
[xml]$xml = Get-Content data.xml
$filter=$xml.ReportOutput.ReportFilters
$filter.ParentNode.RemoveChild($filter)
但遍历数据有点棘手。
$xml.ReportOutput.ChildNodes | Export-Csv "C:\Temp\report.csv" -NoTypeInformation -Delimiter:"," -Encoding:UTF8
CSV 文件中的第一条记录是单个属性'"columnHeader"',第二条记录是'"System.Object[]"',之后有很多空行。
{
$xml.ReportOutput.ReportHeader | ConvertTo-Csv -NoTypeInformation -Delimiter:","
foreach ($r in $xml.ReportRecord) {
$r | ConvertTo-Csv -NoTypeInformation -Delimiter:","
}
} | Set-Content -Path "C:\Temp\report.csv" -Encoding:UTF8
将部分源代码写入输出流。
$xml.ReportOutput.ReportHeader | ConvertTo-Csv -NoTypeInformation -Delimiter:"," | Set-Content -Path "C:\Temp\report.csv" -Encoding:UTF8
foreach ($r in $xml.ReportOutput.ReportRecord) {
$r | ConvertTo-Csv -NoTypeInformation -Delimiter:"," | Add-Content -Path "C:\Temp\report.csv" -Encoding:UTF8
}
只是写了很多废话。
$xml.ReportOutput.ReportHeader.ChildNodes | ConvertTo-Csv -NoTypeInformation -Delimiter:"," | Set-Content -Path "C:\Temp\report.csv" -Encoding:UTF8
foreach ($r in $xml.ReportOutput.ReportRecord) {
$r.ChildNodes | ConvertTo-Csv -NoTypeInformation -Delimiter:"," | Add-Content -Path "C:\Temp\report.csv" -Encoding:UTF8
}
有数据 - 但作为每条记录的一个属性
解决方案
我真诚地相信您的 XML 文档是有效的,并且其中的所有结束标记都是正确的(作为提示)。所以...
# create header of the future CSV (attr1,attr2,attr3...)
$csv = @(($xml = [xml](Get-Content C:\path\input.xml)).SelectNodes('//columnHeader').'#text' -join ',')
# append lines to the future CSV
$csv += $xml.SelectNodes('//ReportRecord').ForEach{$_.item -join ','}
# at present moment $csv is the array
# attr1,attr2,attr3...
# 1,first,A...
# 2,second,B...
# time to write this data as CSV on disk
$csv | ConvertFrom-Csv | Export-Csv C:\path\output.csv
希望这可以帮助。
推荐阅读
- python - 在 While 循环 python 中返回“错误”
- c++ - C++11:带有 std::move() 的“decltype 类实例声明”不调用“移动构造函数”。为什么?
- javascript - 如何在 JavaScript 源代码中分别调用 .Ashx 类中的两个方法:?
- matlab - 重复一组数字后拆分列
- node.js - Cheerio npm : 从脚本中获取数据返回空白 ~ node.js
- scala - 用自己和这个参考理解真正的蛋糕图案代码
- angular - 带有 HttpParams 和 Python Pyramid 后端的 Angular HttpClient
- nginx - 请求偶尔丢失,Nginx + Phusion Passenger + Rails 5
- jekyll - Jekyll:如何从位于子文件夹中的 html 访问`_posts`?
- ruby-on-rails - 定义 2 个模型之间的关系