python - 美丽的汤输出到数据框
问题描述
我正在用漂亮的汤刮谷歌学者。使用下面的代码,我只得到数据帧的第一行。需要在数据帧中逐行获取三个输出。不知道如何去做,我是新手。谢谢
查询 = ['10.1371/journal.pone.0213627', '10.1186/s13223-019-0377-7', '10.1371/journal.pmed.1002751']
出版物= []
with requests.Session() as s:
for query in queries:
url = 'https://scholar.google.com/scholar?q=' + query + '&ie=UTF-8&oe=UTF-8&hl=en&btnG=Search'
r = s.get(url)
soup = bs(r.content, 'lxml') # or 'html.parser'
title = soup.select_one('.gs_rt a')
if title is None:
title = 'No title'
link = 'No link'
else:
link = title['href']
title = title.text
citations = soup.select_one('[title=Cite] + a')
if citations is None:
citations = 'No citation count'
else:
citations = citations.text
publications.append ((title, link,citations))
df = pd.DataFrame(publications)
df
输出
解决方案
您可以尝试以下代码,而不是:
df = pd.DataFrame(publications)
采用
df = pd.DataFrame({"content":publications})
推荐阅读
- xml - 如何从 XML 字符串中删除 XML 意图。?
- reactjs - 在 Go 中从 Back 发送 Cookie,这是一个 api 休息,使用 React JS 发送到前端
- c# - 是否可以修改内存中的内容?
- android - 颤振:ListWheelScrollView 放大镜不起作用
- java - 在基于 Spring Boot 的应用程序中使用 REST API 输入在运行时设置模式名称
- java - 加入两个数据帧,限制一个数据帧的行
- c++ - ESP8266,Twilio 不发送短信
- cmake - MinGW64 下 g++ 的 "-x c++" 标志导致 "stray [...] in program" 错误
- javascript - 按钮功能正确,但是单元测试报错
- github - 如何将彩色文本放入 githubs README.md 或 Index.md 文件