r - 如何在表格中构造 Web 数据
问题描述
我的第一个 R 脚本会像这样抓取一个网络表格:
RACE2<U+00A0>CLS5<U+00A0>1200M<U+00A0>ST<U+00A0>GRS<U+00A0>ARATE:(0-40)<U+00A0>GING:FAST
如何将其更改为如下所示的行和列数据框
前 6 列我需要添加我的列名,最后 2 列我使用来自网络数据的名称
我怎样才能做到这一点
解决方案
我认为你不能,因为此时数据太混乱了。
如果您运行此行来替换<U+00A0>
s
gsub("<U\\+00A0>", " ", "RACE2<U+00A0>CLS5<U+00A0>1200M<U+00A0>ST<U+00A0>GRS<U+00A0>ARATE:(0-40)<U+00A0>GING:FAST")
你会得到
RACE2 CLS5 1200M ST GRS ARATE:(0-40) GING:FAST
你可以从那里继续
library(tidyverse)
gsub("<U\\+00A0>", "\\\n", "RACE2<U+00A0>CLS5<U+00A0>1200M<U+00A0>ST<U+00A0>GRS<U+00A0>ARATE:(0-40)<U+00A0>GING:FAST") %>%
str_split(pattern="\\\n", simplify)
产生
[[1]]
[1] "RACE2" "CLS5" "1200M" "ST" "GRS" "ARATE:(0-40)"
[7] "GING:FAST"
但我认为您的数据包含太多缺少的属性名称,太少的“:”分隔符,并且不可能可靠地检测 NA 值。
推荐阅读
- php - Cakephp 3.6.14:在控制器中为视图中的选择框进行选择并禁用它
- c++ - 在 Windows 上使用 WinSSL 构建静态 libcurl 库
- python - Python中随机包代码的问题
- javascript - 为什么 cancelledPromise 模式被认为比 React 中的 isMounted() “反模式”更好?
- excel - 获取“无法获取 WorksheetFunction 类的匹配属性”错误
- postgresql - 如何从 Grafana 的数据库中选择 DISTINCT 记录
- android - 在 onResume 中使用处理程序检查服务状态
- xml - 将 XML 转换为 CSV 时获取空 CSV
- vuejs2 - Flatpickr 不使用计算道具(VueJs)重新渲染
- css - 当孩子的身高大于鹦鹉高度时,通过保持比例缩放孩子(里面有图像)