首页 > 解决方案 > 为 Telcom 生成 summpy 数据集的问题

问题描述

需要您帮助我解决此问题:

问题陈述 - 我需要为过去 6 个月的电信域创建一个虚拟数据集。我使用随机数生成日期和时间,并使用以下代码在 Pandas 中创建。我可以为此数据集在 pandas 中生成其他列,但我坚持使用随机日期和时间:

test = pd.DataFrame({ 'Date':pd.date_range(start='2016-09-20',freq='1h', period=10000) })

这将创建一个周期性数据和时间条目,其精确差异为一小时。示例输出显示:

日期 0 2016-09-20 00:00:00 1 2016-09-20 01:00:00 2 2016-09-20 02:00:00 3 2016-09-20 03:00:00 4 2016-09- 20 04:00:00

但我需要特定的东西来创建数据集:

a) 上午 8 点到晚上 8 点之间的时间戳需要更多随机日期和时间条目,因为每个条目代表一个呼叫条目。b) 晚上 8 点到早上 8 点之间的时间戳的随机日期和时间条目需要更少的条目,因为晚上打电话的人更少。c) 周末(周六和周日)需要更少的随机日期和时间条目

任何人都可以帮助我为此提供方法和解决方案吗?这些条件是在此数据集上执行 ML 建模的需要,并且在这些条件下,这个笨拙的数据集对于电信部门将更加现实。

标签: python-3.x

解决方案


推荐阅读