python-3.x - 对生成器执行频率分布计数,并返回大于 n 的值
问题描述
有没有办法对指向列表列表的生成器对象执行计数?如果是这样,我可以让计数操作输出前一个生成器对象的生成器对象(计数项目)吗?然后我想获得频率计数。我正在使用生成器来节省内存并防止崩溃。我的真实数据集/列表是巨大的!
我有一个生成器对象“gen_list”,它是从列表列表中创建的,我将向您展示如果生成器对象被打印出来的列表是什么样子:
In [1]: ll = [(('color'), ('blue')), (('food'), ('grapes')), (('color'), ('blue'))]
# create generator object 'test2'
In [2]: genobj = (each for each in ll)
# create a generator object with counted items
In [3]: count = (test2.count((i), i) for i in test2)
# list count
In [4]: list(count)
这会产生错误:
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-72-83b1c94e3edd> in <module>()
----> 1 list(count)
<ipython-input-70-829ea68a1314> in <genexpr>(.0)
----> 1 count = (test2.count((i), i) for i in test2)
AttributeError: 'generator' object has no attribute 'count'
所以我被困在这里。如果我能解决这个问题,我可以继续获取频率计数(以生成器对象的形式),它看起来像:[(2, ('color', 'blue')), (1, ('food ', 'grapes')), (2, ('color', 'blue'))] 那么我只想保存值大于 2 的项目,以进行可视化分析。
解决方案
推荐阅读
- html - 是否可以使用 CSS 更改 Wordpress 中按钮中的链接?
- r - 使用带有寓言和咕噜声的 ETS 的动态趋势或季节性参数的问题
- scikit-learn - 如何修复:ValueError:解包的值太多(预期为 2)PCA
- javascript - React:在 JSON 中传递函数
- python - 在 Pyomo 中使用 core.base 变量向 ConcreteModel 添加二次圆锥约束
- sql - 我在 Access SQL 代码中不断收到“语法错误 FROM 子句”
- css - CSS:如何全选
在 .class 内? - javascript - 组内的 FabricJs 对象缩放重新对齐组项而不是固定位置
- c++11 - 填写特定大小的文件 - 我将如何做到这一点
- ansible - 带有 include_tasks 的 Ansible Playbook