首页 > 解决方案 > 使用 ImportHTML 或 ImportXML 在 Google 表格中选择不连续的列、删除行和添加排序列

问题描述

我想将https://www.pro-football-reference.com/years/2020/draft.htm中的表格信息导入Google 表格。但是,我试图避免拉入空单元格以及我在其他工作表中已经拥有的信息。以下是我的问题:

  1. 我想要的唯一列是 Round (col1)、Pick (Col2) 和 Player (Col4)。我已经尝试过使用 ImportHTML,到目前为止,我所能做的就是抓住整张桌子。
  2. 我想创建一个名为“Rd.Pick”的新列,它将选择列转换为他们在各自回合中选择的表示。所以又名 Pick 33 将显示 2.1
  3. 最后,我希望能够删除在一轮的最后一个选秀之间但在下一轮的第一个选秀之前列出的行。鉴于这些行中的文本与标题行匹配,我不确定该怎么做。

标签: web-scrapinggoogle-sheetsarray-formulasgoogle-sheets-querygoogle-sheets-importxml

解决方案


尝试:

=ARRAYFORMULA(QUERY({
 QUERY(IMPORTHTML("https://www.pro-football-reference.com/years/2020/draft.htm", 
 "table", 1), "select Col4"), 
 QUERY(IMPORTHTML("https://www.pro-football-reference.com/years/2020/draft.htm", 
 "table", 1), "select Col1")&"."&
 QUERY(IMPORTHTML("https://www.pro-football-reference.com/years/2020/draft.htm", 
 "table", 1), "select Col2")}, "where not Col2 matches '\.'", 1))

在此处输入图像描述


推荐阅读