python - 如何在aws s3中找到指定日期内的学生人数?
问题描述
我想查找在 s3 文件夹中拥有文件的学生总数。我的目录结构为:
s3://bucket/student=10/year=2019/month=05/...
假设日期是年 = 2019,月 = 06,那么我想找到具有上述日期的文件夹中存在的文件的学生 id 总数。
我在python中使用boto3。
s3 = boto3.resource("s3")
ob = s3.Bucket("bucket")
dic = {}
dic["total students"] = []
for n in range(5):
date = end_date - timedelta(days=n)
date = date.strftime(f'year=%Y/month=%m/')
for obj in ob.objects.filter(Prefix=f'/student_id={student_id}/{date}'):
.....
if student_id not in dic["total students"]:
dic["total students"+student_id].append(student_id)
但是,我认为这不是一个好方法。有没有办法直接统计学生人数
解决方案
推荐阅读
- c# - NuGet.Config 未由 nuget CLI 源命令更新
- shiny - R Shiny:如何使用 tagList() 中的参数来运行函数?
- haskell - 在类型化的 lambda 演算中寻找等价的证明程序
- bash - 如何xcom_push在BashOperator Airflow中解压.gz文件后获得的文件?
- python - 在python中修复用BS4提取的损坏的html表
- python - Matplotlib mplot3d:填充边缘以获得“凸面”
- typo3 - Typo 3 v9 - 路由增强器
- python - 带有漂亮汤的 Python 自定义 nagios 脚本 - 获取“NRPE:无法读取输出”
- solr - Solr按每个单词的开头搜索
- javascript - 寻找一种基于另一个项目的 ID 来选择类的方法