首页 > 解决方案 > GCP AutoML“复杂”示例

问题描述

我正在使用 GCPs AutoML 产品首次涉足 ML 类型的工作。我在一家供水系统技术公司工作,希望使用 AutoML 来识别潜在客户。我们有一个事件数据集,其中包括 1950 年至 2020 年之间的日期、坐标、一些关于事件的数字数据,以及一个名称,用于标识在同一“位置”发生的具有不同坐标或日期的两个事件。

这些信息应该足以推断我们的产品/服务在某个地理区域内是否存在良好的广告机会。目前对数据集的理解是,在相似的时间范围和地理范围内的一组事件应该表明对我们产品的潜在需求,我认为可能会引入额外的数据,例如。平均收入,以前的客户/网络访问等。

数据集没有任何字段可以量化事件对客户来说是好还是坏指标。这是我不知道如何继续的地方。

我们准备在地理区域内做一些测试广告,以确定我们的人工分析是否准确。然后使用这些测试的结果为我们在广告中使用的“训练数据”设置一个值。

我想这更像是一个工作流/数据科学问题,而不是一个 GCP AutoML 问题。

示例数据:(大“D”和小“F”/“L”以及地理和时间集群表示该地理区域的潜在客户。)数据集目前有 50,000 多个条目。

NAME    COORDINATE     DATE          D    F    L    No.
FFAY    xx.aa yy.aa    1950/02/15    50   5    15   1
FFAY    xx.ab yy.ab    1950/02/15    75   2    19   2
FFAY    xx.ac yy.ba    1950/02/16    60   9    22   3
FFAY    xx.ad yy.cb    1950/02/17    50   5    25   4
IATT    yx.aa xy.aa    1958/11/04    90   2    17   1
IATT    yx.aa xy.aa    1958/11/08    75   3    13   2
IATT    yx.aa xy.aa    1975/06/22    55   5    32   1
IATT    yx.aa xy.aa    1975/06/22    67   12   45   2

.....
.....
.....

FFAY    xx.af yy.af    1999/05/27    20   3    7   1
FFAY    xx.ag yy.ag    1999/05/30    22   7    9   2

标签: datasetdata-sciencegoogle-cloud-automlautoml

解决方案


推荐阅读