web-scraping - 使用 ImportHTML 或 ImportXML 在 Google 表格中选择不连续的列、删除行和添加排序列
问题描述
我想将https://www.pro-football-reference.com/years/2020/draft.htm中的表格信息导入Google 表格。但是,我试图避免拉入空单元格以及我在其他工作表中已经拥有的信息。以下是我的问题:
- 我想要的唯一列是 Round (col1)、Pick (Col2) 和 Player (Col4)。我已经尝试过使用 ImportHTML,到目前为止,我所能做的就是抓住整张桌子。
- 我想创建一个名为“Rd.Pick”的新列,它将选择列转换为他们在各自回合中选择的表示。所以又名 Pick 33 将显示 2.1
- 最后,我希望能够删除在一轮的最后一个选秀之间但在下一轮的第一个选秀之前列出的行。鉴于这些行中的文本与标题行匹配,我不确定该怎么做。
解决方案
尝试:
=ARRAYFORMULA(QUERY({
QUERY(IMPORTHTML("https://www.pro-football-reference.com/years/2020/draft.htm",
"table", 1), "select Col4"),
QUERY(IMPORTHTML("https://www.pro-football-reference.com/years/2020/draft.htm",
"table", 1), "select Col1")&"."&
QUERY(IMPORTHTML("https://www.pro-football-reference.com/years/2020/draft.htm",
"table", 1), "select Col2")}, "where not Col2 matches '\.'", 1))
推荐阅读
- javascript - 如何在使用带有反应路由器的嵌套导航时获得不同的屏幕?
- sql-server - 我的左连接返回的行数比预期的多
- python - 常数空间中的 Python 排序 O(1)
- javascript - 异步函数返回未定义
- swift - 如何在 UITableView 中更新 RSS 数据?
- angular - 带有百分比(%2)的查询参数的角度不呈现页面
- python - 为什么 Microsoft python 分析引擎无法识别 vs 代码上的一些 dunders(魔术方法)?是否有替代扩展可以使用?
- mysql - MySQL:查询COUNT次一列中的值等于另一列中的值
- python - 安装 requirements.txt 错误
- python - 如何填充由多条曲线组成的形状?