sql - 如何从数据库中提取研究论文的文本
问题描述
我想知道我是否可以制作一个算法,从数据库中提取研究论文的文本,比如 PubMed。
可能,查询语言是相关主题。
首先,一个搜索条件匹配的数据库程序,比如论文抄袭检查程序,可以用Python语言编写吗?
我认为论文抄袭检查程序给了我很多提示。
其次,这些程序如何搜索文本以检查与输入论文的相似性?
我发现很多研究论文不是免费的,他们的文本不允许直接搜索。
解决方案
我制作了一个名为Findpapers的工具,它对你很有用。它根据来自多个数据库(包括 PubMed)的关键字收集论文。
收集完论文的 PDF 后,我建议您使用Tesseract提取文本并进行任何您喜欢的处理。
推荐阅读
- java - 在 XML Spring 配置中将 PersistenceContext 设置为 EXTENDED
- c# - 带或不带参数调用的 WebMethod
- c++ - 具有虚拟基类的可变类方法
- asp.net-mvc - ajax-post请求后如何防止SignalR客户端重新连接?
- ios - 使用 Apple 登录 - 手动表单
- sql-server - 当 SQL Server 和客户端软件在同一台计算机上时,SQL Server Always Encrypted 功能如何工作?
- sql - 在 Amazon REdshift 中查看权限 - 重新创建基础表并阻止查看权限
- jquery - 使用 getScript 加载外部脚本显示未定义
- docker - “docker ps”命令不报告从 traefik 反向代理服务使用的端口
- javascript - React 从其他组件调用函数