首页 > 解决方案 > 如何使用 Twitter API 提取手动注释的推文?

问题描述

我正在使用文本分类对方言进行分类。首先,我需要一个大型手动注释的推文,并且我阅读了一篇研究论文,上面写着:

我们收集了 2015 年 6 月发布的推文。阿拉伯语言学家手动注释了这些推文的一小部分,因此我们获得了 51,589 条带有正确方言标签的推文。这些推文是在 Twitter 中手动找到的,并由语言学家进行注释。

所以这位研究人员能够提取这些推文,我想联系他,但他们的电子邮件无效。他说这些推文是在 2015 年 6 月发布的。我怎样才能提取这些推文?

标签: twittertext-classificationcorpustagged-corpus

解决方案


我不得不假设研究人员在 2015 年 6 月期间实时完成了这项工作。

今天,做到这一点的唯一方法是使用 Full Archive Search API(Twitter 提供的高级付费产品)来搜索这些推文。就注释而言,这些将是他们研究的一部分;Twitter 不会使用方言标签对推文进行注释。


推荐阅读