python - 通过从头开始解析给定的单词集合来定义预定义大小的新单词集合
问题描述
我有一组单词(700 个)。我需要从这个集合的开头解析单词以填充我的新集合,直到我的新集合的单词总数达到 1024(预定义数)。
例子:
collection 1: aaa bbb ccc ddd eee fff ggg hhh iii jjj
collection 1 size: 10 words
collection 2: aaa bbb ccc ddd eee fff ggg hhh iii jjj aaa bbb ccc ddd eee
collection 2 size: 15 words(desired/predefined size)
解决方案
您可以使用 itertoolscycle
并islice
为此。cycle
会给你一个列表的重复迭代器,islice
让你挑选你想要的数字。例如,要从 10 个列表中获取 20 个重复集:
from itertools import cycle, islice
collection = "aaa bbb ccc ddd eee fff ggg hhh iii jjj".split()
sample = islice(cycle(collection), 20)
print(list(sample))
结果:
['aaa', 'bbb', 'ccc', 'ddd', 'eee', 'fff', 'ggg', 'hhh', 'iii', 'jjj', 'aaa', 'bbb', 'ccc', 'ddd', 'eee', 'fff', 'ggg', 'hhh', 'iii', 'jjj']
推荐阅读
- c# - 如何在 Entity Framework Core 的迁移中执行本机 SQL?
- azure - 从 Azure 数据工厂 (ADF) 调用 Azure Function 时出现异常
- mysql - 如何在一张表 MySQL 中制作故事和保存的故事?
- python - 矩阵及其逆的乘积
- email - JavaMail 与 Outlook
- sql - SQL Count 然后 Sum?
- java - 如何将元素添加到java中排序数组中的正确位置
- mysql - 将连接转换为mysql上的子查询
- ruby - 为已获救的异常编写 RSpec 测试
- apache-spark - 如何在第二个数据集上过滤内部数组 ID?