r - 有没有办法使用 Reddit ExtractoR 只查看帖子标题并排除评论?
问题描述
标题:我希望使用 Reddit ExtractoR 从 2021 年 1 月 1 日以来的特定 subreddit 中提取所有帖子标题。我不知道如何引导该功能只查看帖子标题而不添加任何评论。我在下面发布了我的代码的当前版本:
reddit_test <- get_reddit(search_terms = NA, regex_filter = "", subreddit = "subreddit_name",
cn_threshold = 1, page_threshold = 12000, sort_by = "new",
wait_time = 2)
解决方案
该get_reddit()
函数似乎总是返回注释。
看github https://github.com/ivan-rivera/RedditExtractoR
该reddit_urls()
函数将返回更少的属性,标题是其中之一:
> reddit_links <- reddit_urls( search_terms = "cute_cats", page_threshold = 1 )
>
>
> str(reddit_links) 'data.frame': 25 obs. of 5 variables:
> $ date : chr "05-02-15" "24-02-14" "03-09-13" "20-05-14" ...
> $ num_comments: num 214 26 221 36 44 41 93 199 20 175 ...
> $ title : chr "My brother's cat is insanely cute!" "...
> $ subreddit : chr "cats" "cats" "cats" "cats" ...
> $ URL : chr "http://www.reddit.com/r/cats/comments/2uv9q5/my_brothers_cat_is_insanely_cute/?ref=search_posts" ...
推荐阅读
- types - rustc 奇怪地假设类型参数必须相同,即使它们是分开的?
- autohotkey - 如何在 Autohotkey 中通过 RegExp 匹配包含键名的字符串
- python - 带有 GUI 的键侦听器脚本不起作用 (Tkinter)
- r - 使用 Gauss-Hermite 求积评估二元正态分布
- deprecated - 在 2019 年 12 月 6 日 Google Drive Android API 关闭后,Games.Snapshots.open 和所有其他已弃用的 Games API 调用是否会继续工作?
- amazon-web-services - 放置存储桶策略时访问被拒绝
- python - 使用两个整数变量之间差异的逻辑
- node.js - 如何使用 emscripten 通过 node.js 进行文件输入?
- .net - XML 使用带有导入的 XSD 进行验证,并包含在 .net 核心中
- python - 如何按整数对元组的混合列表进行排序?