首页 > 解决方案 > 我在哪里可以找到包含不同主题的科学研究论文的数据集?

问题描述

我试图找到一个包含来自不同感兴趣领域(例如,神经科学、数学、物理学、历史、生物学、医学等)的科学论文的数据集,以便开发一个旨在总结科学文本同时改变特定领域的 NLP 项目将术语转化为更常用的词。

有人知道我在哪里可以找到这样的数据集吗?

标签: nlpdataset

解决方案


armancohan提供的5GB数据集应该可以。

正如他所指出的:

提供了两个长篇和结构化文档(科学论文)的数据集。数据集来自 ArXiv 和 PubMed OpenAccess 存储库。

或直接从TensorFlow 数据集获取。


推荐阅读