首页 > 解决方案 > 解析 dicom 中特殊字符的问题具有韩国患者姓名

问题描述

我正在使用 daikonjs( https://github.com/rii-mango/Daikon ) 来解析 dicom 文件。但我在韩语方面遇到问题,解析返回后的患者姓名包含一些特殊符号。但是当我使用 radiAnt 应用程序或 dicom4che 时,结果没有特殊符号。现实:�$)C김귀순 预期:김귀순 这是一个具有韩国患者姓名的 dicom 文件:“ https://github.com/rii-mango/Daikon/files/3696509/filenameHQ.zip

标签: javascriptcharacterdicom

解决方案


属性特定字符集 (0008,0005) 定义用于对 DICOM 数据集中的字符串值进行编码的字符集。在你的情况下,它说

(0008,0005) CS [\ISO 2022 IR 149]                       #  16, 2 SpecificCharacterSet

这意味着使用了 2 个字符集:

  1. US ASCII (ISO_IR 6) - DICOM 中的默认字符集,因此没有显式指定,而是隐式指定第一个属性值(反斜杠之前)

  2. 使用代码扩展技术的韩语字符集 (ISO 2022 IR 149)。

使用两个不同的字符集需要使用 ISO 2022 代码扩展技术。这通过添加一个切换字符集的特殊字符序列来工作 - 这里:$)

显然,Daikonjs(以前从未听说过)不支持代码扩展技术,因此无法识别字符集的切换。

编辑:顺便说一句,我希望你匿名数据集。它看起来像关于患者、医院和医生的真实信息仍然存在于其中。这违反了世界上大多数国家的隐私立法(虽然不确定韩国)。


推荐阅读