python - 获取此数据的正确 xpath 是什么?
问题描述
我正在尝试访问某些 html 中的值,但我无法正确获取 xpath。
我尝试了几个 xpath 教程,也查看了几个 stackoverflow 响应,当然还有反复试验。我错过了一些重要的事情。
这是路径大致的样子:
div id='container' class='container' role='main'
div class = 'row-fluid'>
div class = 'col-md-12'
div id = 'canvas
div id = 'Error' class = 'error' align = 'center' </div>
div id = 'subcanvas'
div id = 'w-box' class = 'grid-stack-instance-9644' [etc..]
div id = 'widget1' class = 'panel panel-default' style = 'overflow: initial !important;'
div class = 'grid-stack-item-content cell'
table id = 'RptGrowthStatistics' class ='table stoff table-bordered table-condensed table-responsive etc...
<thead>
<tbody>
<tr>
<td nowrap='nowrap' class='L0'>
<a>South San Francisco</a>
<td/>
<!---->
<td class="Right">5,437</td>
<td class="Right">282.78</td>
<td class="Right">4.36</td>
<td class="Right">3,573</td>
<!---->
<td class="Right">3,354</td>
<td class="Right">5,737</td>
<td class="Right">6,680</td>
<td class="Right">876.07</td>
我正在尝试进入那个 td 类 = 您列出了“南旧金山”以及任何其他 td 值的地方。这就是我想要的数据。我已经尝试过
xpath(//table[@id="RptRoomStats"]/tbody/tr[1]/td[1]/a)
没有成功。
我可以深入到 {'id' : 'subcanvas'} 但无法超越这一点
# gives {'id': 'Error', 'class': 'error', 'align': 'center'}
x = tree.xpath(".//form[@name]/div[5]/div/div/div/div")
print(x[0].attrib)
解决方案
推荐阅读
- python - 如何在 Pandas 中读取带有引号字符和逗号的 CSV 文件?
- c - 在 c 中打印 char 常量的大小
- duplicates - Mautic-Pipedrive 中的重复/三重触点
- python - 堆叠 RBM 以在 sklearn 中创建深度信念网络
- android - 为什么按钮让我的画布在 Android 中绘制成六边形?
- swift - 在 almofire 中调用带有标头、HTTP 方法、参数和回调到被调用类的 api
- swift - 对成员“地图”的模糊引用
- reactjs - ReactJS - 读取 json 值,第一级值是可读的,但是第二级显示错误
- javascript - 反应,排序和对象数组(减少和映射?)
- php - 检查文件是图像还是pdf