r - 访问小标题内列表中的最后一个元素
问题描述
我使用keyword_search从pdf中提取数据,最终将结果汇总在一个小标题中。这很好,但是现在我想进一步总结一下tibble的“token_text”列表中存储的数据,我特别只对每行列表的最后一个元素感兴趣。但是,我知道如何在列表中提取元素的功能似乎不适用于小标题?
例如,如果我有一个列表元素“a”,那么我可以访问该列表中的最后一个元素:
sapply(a,tail,1)
但是,这似乎在 tibble 中不起作用:
result$token_text, tail,1)
因为这只给了我整个列表,而不是列表的最后一个元素。我错过了什么?
下面是我的“结果”小标题的输入。
提前感谢您的帮助。
structure(list(keyword = c("124-38-9", "124-38-9", "124-38-9",
"124-38-9", "124-38-9", "124-38-9", "124-38-9", "124-38-9", "124-38-9",
"124-38-9", "124-38-9", "124-38-9", "124-38-9", "124-38-9", "74-82-8",
"74-82-8", "74-82-8", "74-82-8", "74-82-8", "74-82-8", "74-82-8",
"74-82-8", "74-82-8", "74-82-8", "10024-97-2", "10024-97-2",
"10024-97-2", "10024-97-2", "10024-97-2", "10024-97-2", "10024-97-2",
"10024-97-2", "10024-97-2", "10024-97-2"), page_num = c(20L,
21L, 21L, 21L, 21L, 21L, 22L, 22L, 22L, 23L, 23L, 24L, 24L, 24L,
21L, 21L, 22L, 22L, 23L, 23L, 23L, 24L, 24L, 24L, 21L, 21L, 22L,
22L, 23L, 23L, 23L, 24L, 24L, 24L), line_num = c(500L, 503L,
504L, 516L, 517L, 518L, 527L, 533L, 542L, 550L, 559L, 567L, 573L,
579L, 505L, 519L, 528L, 534L, 545L, 551L, 560L, 568L, 574L, 580L,
506L, 520L, 529L, 535L, 546L, 552L, 561L, 569L, 575L, 581L),
line_text = list("124-38-9 CO2 nonbio 8812.3593 8812.3593",
"124-38-9 CO2 bio-nC 0 0",
"124-38-9 CO2 bio-C 0 0",
"124-38-9 CO2 nonbio 0 0",
"124-38-9 CO2 bio-nC 0 0",
"124-38-9 CO2 bio-C 0 0",
"124-38-9 CO2 8411.7989 8411.7989",
"124-38-9 CO2 0 0",
"124-38-9 CO2 392.9536 392.9536",
"124-38-9 CO2 4.0087 4.0087",
"124-38-9 CO2 3.5981 3.5981",
"124-38-9 CO2 0 0",
"124-38-9 CO2 0 0",
"124-38-9 CO2 0 0",
"74-82-8 CH4 83.0642 2076.6050",
"74-82-8 CH4 0 0",
"74-82-8 CH4 7.8340 195.8500",
"74-82-8 CH4 0 0",
"74-82-8 CH4 2.0398 50.9950",
"74-82-8 CH4 30.4243 760.6075",
"74-82-8 CH4 42.7661 1069.1525",
"74-82-8 CH4 0 0",
"74-82-8 CH4 0 0",
"74-82-8 CH4 0 0",
"10024-97-2 N2O 0.2146 63.9508",
"10024-97-2 N2O 0 0",
"10024-97-2 N2O 0.2139 63.7422",
"10024-97-2 N2O 0 0",
"10024-97-2 N2O 0.0007 0.2086",
"10024-97-2 N2O 0 0",
"10024-97-2 N2O 0 0",
"10024-97-2 N2O 0 0",
"10024-97-2 N2O 0 0",
"10024-97-2 N2O 0 0"),
token_text = list(list(c("124", "38", "9", "co2", "nonbio",
"8812.3593", "8812.3593")), list(c("124", "38", "9", "co2",
"bio", "nc", "0", "0")), list(c("124", "38", "9", "co2",
"bio", "c", "0", "0")), list(c("124", "38", "9", "co2", "nonbio",
"0", "0")), list(c("124", "38", "9", "co2", "bio", "nc",
"0", "0")), list(c("124", "38", "9", "co2", "bio", "c", "0",
"0")), list(c("124", "38", "9", "co2", "8411.7989", "8411.7989"
)), list(c("124", "38", "9", "co2", "0", "0")), list(c("124",
"38", "9", "co2", "392.9536", "392.9536")), list(c("124",
"38", "9", "co2", "4.0087", "4.0087")), list(c("124", "38",
"9", "co2", "3.5981", "3.5981")), list(c("124", "38", "9",
"co2", "0", "0")), list(c("124", "38", "9", "co2", "0", "0"
)), list(c("124", "38", "9", "co2", "0", "0")), list(c("74",
"82", "8", "ch4", "83.0642", "2076.6050")), list(c("74",
"82", "8", "ch4", "0", "0")), list(c("74", "82", "8", "ch4",
"7.8340", "195.8500")), list(c("74", "82", "8", "ch4", "0",
"0")), list(c("74", "82", "8", "ch4", "2.0398", "50.9950"
)), list(c("74", "82", "8", "ch4", "30.4243", "760.6075")),
list(c("74", "82", "8", "ch4", "42.7661", "1069.1525"
)), list(c("74", "82", "8", "ch4", "0", "0")), list(c("74",
"82", "8", "ch4", "0", "0")), list(c("74", "82", "8",
"ch4", "0", "0")), list(c("10024", "97", "2", "n2o",
"0.2146", "63.9508")), list(c("10024", "97", "2", "n2o",
"0", "0")), list(c("10024", "97", "2", "n2o", "0.2139",
"63.7422")), list(c("10024", "97", "2", "n2o", "0", "0"
)), list(c("10024", "97", "2", "n2o", "0.0007", "0.2086"
)), list(c("10024", "97", "2", "n2o", "0", "0")), list(
c("10024", "97", "2", "n2o", "0", "0")), list(c("10024",
"97", "2", "n2o", "0", "0")), list(c("10024", "97", "2",
"n2o", "0", "0")), list(c("10024", "97", "2", "n2o",
"0", "0")))), row.names = c(NA, -34L), class = c("tbl_df",
"tbl", "data.frame"))
解决方案
您可以使用以下方法执行此操作...
result$last_token <- sapply(result$token_text, function(x) tail(x[[1]], 1))
您需要sapply
沿着列表列表并一次做一个。这假定 的每个元素last_token
都是长度为 1 的列表,其中包含一个向量。
推荐阅读
- java - 如何在android中为自定义视图创建setter和getter
- java - 查找所有级别的 Children 并添加到 ArrayList
- python-3.x - 错误:格式:“svg”无法识别。使用以下之一:
- python - 来自 tkinter gui 的 .exe 不运行(pyinstaller)
- ios - 在iOS中将字符串转换为特定的日期格式为零
- .net - MultipartReader 糟糕的性能还是我做错了什么?
- vb.net - 在多显示器设置中,如何识别 Winform 显示在哪个显示器上?
- python - 找不到页面 404 - Django
- python - 在布尔熊猫系列中查找真后假指数
- c - 使用 GNUmake 运行并行构建