python - 使用 chunksize pandas 查找列的唯一元素
问题描述
给定一个样本(!)数据框:
test =
time clock
1 1
1 1
2 2
2 2
3 3
3 3
我试图用 pandas chunksize 做一些操作:
for df in pd.read_csv("...path...",chunksize = 10):
time_spam = df.time.unique()
detector_list = df.clock.unique()
但它让我可以操作 chunsize 的长度。如果是 10,那么只给我 10 行。
PS 是样本数据
解决方案
请试试:
for df in pd.read_csv("...path...",chunksize = 10, iterator=True):
time_spam = df.time.unique()
detector_list = df.clock.unique()
您需要使用iterator
此处描述的标志:
https://pandas.pydata.org/pandas-docs/stable/user_guide/io.html#io-chunking
推荐阅读
- gateway - 从 curl 绕过公司网关身份验证
- python - 如何阅读 yolov3.custom_final.weights 并逐层可视化它们?我正在使用 AlexyAB Darknet
- scala - 使用 scala 函数和 spark 数据框以可配置的方式应用复杂转换
- python - 如何将现有的 Django ORM 转换为 SQLAlchemy ORM?
- python - 如何对给定数量的价格范围内的累积成本求和?
- python-3.x - Python继承AttributeError:类型对象没有属性
- r - 将数据框列表传递给我自己的函数
- spring - 在创建 slug 之前,如何从 heroku 中的 gradle 任务运行测试?
- android - 从 http://dummy.restapiexample.com/api/v1/employees 从 android 中的 API 获取数据的问题
- python - 在共享主机 Cpanel 终端上运行 Selenium