首页 > 解决方案 > 如何将所有数据提取到拆分行中的雪花对象数组中?

问题描述

我有这个过程,我们指定阶段文件的路径以及应该使用哪种文件格式,然后我们获取它的前 2 列并将其作为具有以下结构的类型数组的变体返回:

result = [
    { dim_label_name: 'Test1', dim_ona_name: 'Ona Test1' },
    { dim_label_name: 'Test2', dim_ona_name: 'Ona Test2' },
]

这是程序:

CREATE OR REPLACE PROCEDURE ADD_FIELD_AND_DIMENSION(FILE_FULL_PATH STRING, FILE_FORMAT_NAME STRING)
RETURNS VARIANT
LANGUAGE JAVASCRIPT
EXECUTE AS CALLER
AS
$$
    var dimension_array = [];
    try{
      // Get the unique values of the available dimensions
      var unique_dimension_query = "SELECT t.$1, t.$2 FROM "+FILE_FULL_PATH+"(FILE_FORMAT=>"+FILE_FORMAT_NAME+") t GROUP BY t.$1, t.$2";
      var unique_dimension_stmt = snowflake.createStatement({sqlText: unique_dimension_query});
      var rs = unique_dimension_stmt.execute();
      var dimension_object = {};
      while (rs.next()) {
        dimension_object['dim_label_name'] += rs.getColumnValue(1);
        dimension_object['dim_ona_name'] += rs.getColumnValue(2);
      }
      dimension_array.push(dimension_object);
      return dimension_array;
    }
    catch(error) {
        return error;
    }
$$;

CALL ADD_FIELD_AND_DIMENSION('@ingest_stage_temp/my_file.csv', 'my_file_format');

返回dimension_array的结构只有一个对象,所有值都适合每个属性:

[
    { 'dim_label_name': 'Test1Test2Test3...', 'dim_ona_name': 'ONA Test1 ONA Test2 ONA Test3...' }
]

如何将所有数据提取到拆分行中的雪花对象数组中?

标签: javascriptsqlstored-proceduressnowflake-cloud-data-platform

解决方案


您对 dimension_array 的推送在您收集结果集的循环之外。它只会将结果集中的最后一行推送到数组中。

此外,您希望使用 = 将字符串分配给数组的元素。+= 将值连接到字符串元素,这就是为什么它们都在一个字符串中。

这部分存在问题:

  while (rs.next()) {
    dimension_object['dim_label_name'] += rs.getColumnValue(1);
    dimension_object['dim_ona_name'] += rs.getColumnValue(2);
  }
  dimension_array.push(dimension_object);

它应该是这样的:

  while (rs.next()) {
    dimension_object['dim_label_name'] = rs.getColumnValue(1);
    dimension_object['dim_ona_name'] = rs.getColumnValue(2);
    dimension_array.push(dimension_object);
  }
  

推荐阅读