首页 > 解决方案 > 将数据从 sas 导出到 CSV 文件

问题描述

我正在尝试从 SAS 下载文件并将其导入 Hadoop。它是一个巨大的数据集 - 6GB。当我将 sas 数据集导出到 csv 文件然后导入回 sas 时。(因为我在 hadoop 中遇到的问题很少,我尝试导入回 SAS 并验证值)。导入在同一工具本身中显示数据集中的问题。列值混乱。很少有列有垃圾值,很少有列重叠如何以 csv 格式导出数据集,并且列值完好无损。

filename output 'AAA.csv' encoding="utf-8";


Proc export data= input_data
            outfile= output
            dbms = CSV;
run;

标签: sasexport

解决方案


只是猜测,但请尝试删除字符串中可能存在的任何行尾字符。

例如,您可以使用简单的数据步骤视图即时转换字符串。这是一个用管道字符替换任何 CR 或 LF 字符的方法。

data for_export / view=for_export;
  set input_data;
  array _c _character_;
  do over _c;
    _c = translate(_c,'||','0D0A'x);
  end;
run;
proc export data=for_export outfile=output dbms=CSV;
run;

您可能还需要注意反斜杠字符。一些读者试图将其解释为转义字符。


推荐阅读