nlp - 我在哪里可以找到包含不同主题的科学研究论文的数据集?
问题描述
我试图找到一个包含来自不同感兴趣领域(例如,神经科学、数学、物理学、历史、生物学、医学等)的科学论文的数据集,以便开发一个旨在总结科学文本同时改变特定领域的 NLP 项目将术语转化为更常用的词。
有人知道我在哪里可以找到这样的数据集吗?
解决方案
armancohan提供的5GB数据集应该可以。
正如他所指出的:
提供了两个长篇和结构化文档(科学论文)的数据集。数据集来自 ArXiv 和 PubMed OpenAccess 存储库。
或直接从TensorFlow 数据集获取。
推荐阅读
- javascript - 带有大精灵的 CSS 精灵动画在开始时冻结
- android - 遍历 RxJava2 中的 Observable 列表
- regex - 用ansible从变量中解析子字符串
- javafx - 是否可以在 Gluon Mobile 上安装 Spring Boot?
- .net - StateMachineAttribute 在 .NET 中的用途是什么?
- c - 如何相互转换异或和非运算符
- angular - '+' 字符在 HttpParams angular 中转换为空格
- python - 如何使用基于python列中先前值的函数创建列
- reactjs - 在任何请求和响应之后,调用一个 api
- kubernetes - 自定义 cloudwatch 指标 EKS CloudWatch 代理