首页 > 解决方案 > 如何从这种字符串中获取关键字

问题描述

我需要从这种字符串中获取“支付类型和客户类型”

   Examples:
      |    D           | A  | B | C |
      |      NZ       | AAA           |     BBB    |      NZ       |
      |      AZ       | CCC           |    DDD        |  AZ  |
      |      CA      | EEE            |    FFF        |  CA  |



我应该尝试获取模式并为此编写一个函数吗?或者我可以找到一些库来检测它

所以输出应该是 {payment:["AAA","CCC",'EEE'], customer:["BBB",'DDD","FFF"]}

function detect(str){
  let countBar=1
  let countBar2=0
  let paymentLoc=NaN
  let customerLoc=NaN
  let after =0
  let arr1=str.split(" ")
  arr1=arr1.filter(item=>{return item!==""})
  let newStr=''
  for(let i=0;i<arr1.length;i++){
    arr1[i].trim()
    if(arr1[i]==='|'){
      countBar++
    }
    if(arr1[i]==="||"){
      countBar2++
    }
    if(arr1[i].includes("payment")){
      paymentLoc=i
    }

   after=((countBar/(countBar2))-1)*2
let sol=[]
  for(let i=0;i<arr1.length;i++){
  if(arr1[i].includes("payment")){
    console.log('payment index',i)
      sol.push(arr1[i+after+1])
    }
    if(arr1[i].includes("customer")){
      console.log('customer index',i)
      sol.push(arr1[i+after+1])
    }


  }


  newStr=arr1.join('')
  console.log(newStr)


}

标签: javascript

解决方案


这个我玩得很开心。我的第一个想法是使用 npm 包,因为字符串看起来很像带有|分隔符的 CSV。包csvtojson是一个很好的包,但是当你可以一起破解一些东西时,为什么还要使用一个备受推崇的库呢?

这是我的第一次尝试(在 Typescript 中):

const exampleString = ` | market | payment type | customer type | translation |
                        | NZ     | AAA          | BBB           | NZ          |
                        | AZ     | CCC          | DDD           | AZ          |
                        | CA     | EEE          | FFF           | CA          |`;

const cleanColumn = (col: string) =>
  col
    .replace("|", "")
    .trim()
    .replace(/\s/, "_");

const cleanRow = (row: string) =>
  row
    .split(/\s\|/)
    .map(cleanColumn)
    .filter(Boolean);

const pivotRows = (
  pivoted: string[][],
  currentRow: string[],
  rowIndex: number
) => {
  if (rowIndex === 0) {
    currentRow.forEach((col, colIndex) => {
      pivoted[colIndex] = [col];
    });
  } else {
    currentRow.forEach((col, colIndex) => {
      pivoted[colIndex].push(col);
    });
  }

  return pivoted;
};

const buildObject = (
  obj: { [key: string]: string[] },
  currentRow: string[]
) => {
  let currentCol: string;

  currentRow.forEach((col, index) => {
    if (index === 0) {
      currentCol = col;

      obj[currentCol] = [];
    } else {
      obj[currentCol].push(col);
    }
  });

  return obj;
};

const detect = (str: string) =>
  str
    .split("\n")
    .map(cleanRow)
    .reduce(pivotRows, [])
    .reduce(buildObject, {});

console.log(detect(exampleString));

如果你看detect,它只是在字符串上执行一系列函数。第一个只是用换行符分割它。我喜欢你对countBar变量的追求,但这似乎更容易。

这给了我们一堆字符串数组,它们需要被分解成列。在这里,我使用了一些正则表达式来分隔 和 的组合之间的所有space内容|。在中,如果有任何落后者cleanColumn(),我会删除剩余|的 s,然后用下划线替换空格,以便它们可以用作对象键。

.filter(Boolean)然后,使用技巧(link)删除空字符串。最后两个函数可能比必要的更冗长,但它们可以完成工作。pivotRows()使用行和列索引将列转换为行。最后,在buildObject()每一行的第一个元素中添加作为对象的键,其余的值被推入字符串数组。

真的,您可能应该只使用csvtojson.


推荐阅读