python - 数据框行切片不一致
问题描述
我有一个DataFrame
名为 ~ 6 百万行的变量data
,我想一次处理 50 行。我有以下代码:
#Only 4001 for debugging purposes
for i in range(0,4001,50):
print(str(i) + " - " + str(i+49))
current_batch = data["text"].loc[i:(i+49)]
print("Batch size: " + str(len(current_batch.tolist())))
但是,似乎获得的切片长度不是 50 行。事实上,它们似乎是随机的(尽管每次我重新运行程序时它们都保持一致。第一个总是 34,然后总是 48 等等......)。这是一个示例输出:
0 - 49
Batch size: 34
50
Batch size: 48
...
这是DataFrame
班级的预期行为吗?
解决方案
推荐阅读
- angular - PrimeNG p-Calendar & AutoComplete 值和验证
- c# - 如何将参数从控制器传递到 FormDialog 状态模型
- linux - Bash:在执行前高亮显示命令(set -x)
- rvest - 如何使用 rvest 分离 html_text 结果?
- image - 如何在 Flutter 中裁剪图像?
- javascript - 冒泡排序功能似乎不起作用
- android - Whatsapp、Facebook 和 Skype 消息如何在后台运行?
- javascript - Codeigniter 列的可数据总和
- r - 闪亮的sliderInput()内的过滤数据?
- mysql - MySQL:许多索引,但在小字段上