首页 > 技术文章 > 行业动态 | 利用云端Cassandra实时推送个性化广告

datastax 2020-12-27 00:17 原文

挪威分类广告公司Finn.no的向云端迁移计划涉及到超过800个应用程序和145个数据库实例,其中包含了一个支持公司的个性化广告推送的关键集群。

 

他们是如何在零运维的情况下达到他们的可用性及性能目标的呢?本文将为您揭晓。


 

一分钟案例速读

  • 用例

个性化广告推荐

  • 行业

分类广告

  • 机会

Finn.no想要将它的IT迁移到云端,以便集中于发展自身的策略和运营方式,而非花费过多精力在管理基础设施上。

这一向云端迁移的计划涉及到超过800个应用程序和145个数据库实例,其中包含了一个支持公司的个性化广告推送的关键集群。

  • 解决方案

运行在Google Cloud Platform上的DataStax Astra

  • 成果
    • 成功将开源Apache Cassandra迁移至在Google Cloud Platform的DataStax Astra中
    • 在云端运行Cassandra且无需担心任何运维工作
    • 基于数据学习模型向用户实时推送广告


 

01 关于Finn.NO

成立于2000年的Finn.no是挪威领先的分类广告公司,它每月的网站访问量约有五千万。顾客可以在Finn.no上进行商品和服务的买卖,其中包含了从日用品到船只、房屋、二手汽车,再到像是贷款、水电费、旅游等服务。


 

02 挑战

在迁移到DataStax Astra之前,Finn.no已经在自己的IT基础设施上运行自家的数据中心多年了。然而Finn.no想要将它的IT迁移到云端,以便集中于发展自身的策略和运营方式,而非花费过多精力在管理基础设施上。

 

这一向云端迁移的计划包含了迁移超过800个应用程序和145个数据库实例。

 

这次迁移计划中包含了一个运行在Apache Cassandra上的关键集群,这个集群是支持公司的个性化广告推送的引擎。这个应用程序通过像是用户的喜好以及历史广告发布记录等数据,来个性化用户访问网站的体验。

 

“这个个性化引擎对我们公司来说至关重要。它帮助我们向可能感兴趣的顾客推销商品,它可以向目标客户群推送付费促销的商品,它还能支持其他公司的个性化服务。它支撑了我们网站大约20%的流量,即上百万次的交互。所以它是我们的业务中非常重要的部分。”
                                     ——FInn.no高级开发程序员Espen Amble Kolstad

 

Finn.no的IT团队在之前已经决定了用Google Cloud Platform来完成这次迁移,并且需要考虑如何将已有的Apache Cassandra集群迁移到云端。根据Finn.no数据智能技术领域专家Benjamin Weina Lager的描述,这一行动对Finn.no的数据智能团队来说来得正是时候。

 

“我们的团队由3名工程师和3-4名数据科学家组成,我们的任务就是要开发能够提升个性化引擎的数据建模和分析。我们内部有一些Cassandra的技能,但是这次迁移计划是一个很好的重新评估的机会。”
                                 ——Finn.no数据智能技术领域专家Benjamin Weina Lager

 

 

作为一个数据库,Apache Cassandra可以在跨平台的环境下同时运行多个云服务。尽管如此,Finn.no团队还是想寻求Cassandra的托管服务。


 

03 解决方案

 

Finn.no的团队广泛联系了Cassandra社区的成员,与他们讨论公司遇到的挑战。社区的成员们向Finn.no推荐了DataStax Astra。

 

Astra是一个建构在Apache Cassandra基础上的“数据库即服务(Database-as-a-Service)”平台,开发者可以利用Astra在云端快速部署大量的应用程序。点击文末“阅读原文”了解更多关于Astra的信息。

 

Astra包括了Google Cloud Platform的原生支持,所以Finn.no可以将Cassandra集群的迁移纳入他们更大范围的云项目之中。

 

“我们以前使用开源版本的Cassandra,但是我们以后想要得到有关我们实例的运行的相关支持。DataStax Astra代表着我们在向托管的Cassandra服务前进,这不仅可能会成为我们公司整体迁移上云的一部分,还会长期为我们提供更多的支持和专业技能。对我们来说,Astra是我们迁移上云的完美选择。”
                                 ——Finn.no数据智能技术领域专家Benjamin Weina Lager

 


 

04 主要成果

Finn.no将Cassandra应用在它的数据湖,作为它的数据科学管道(data science pipeline)的一部分。Finn.no的数据智能团队从数据湖中获取数据,然后用Python建构他们的模型。

 

这些模型会被加载到公司的API框架中,并将同Cassandra集群中的数据一起被使用。Finn.no的Cassandra集群有三个集群,每个集群分别有三个节点。

 

“我们的Cassandra集群从用户行为和数据模型中获取最新的数据,然后用这些来个性化用户们看到的广告。也就是说,这些都需要在用户浏览网站的时候实时发生。另外,我们用DataStax提供的工具来限制我们储存的用户数据的总量,从而尊重和保护顾客的隐私。我们的数据模型内不会存任何无用的数据。DataStax提供了我们的个性化引擎所需的速度和可用性。”
                                    ——FInn.no高级开发程序员Espen Amble Kolstad

 

在使用了DataStax Astra之后,Finn.no还与DataStax一起协作设计了支持他们的个性化引擎所需的性能和可用性水平的方案。

 

这帮助Finn.no的数据智能团队满足了Finn.no团队所需的推荐功能的速度,并支持了Schibsted Group公司中更多的组织在他们的日常工作中使用个性化功能和数据科学。

 

“个性化很难做到,但是这对我们的业务和我们的团队来说是至关重要的。想要达到目的,就必须要让数据科学、基础设施和客户价值协调在一起。DataStax Astra提供了我们的Cassandra集群所需的性能和可用性,并帮助我们完成了我们的客户非常重视的推荐功能。”
                                    ——FInn.no高级开发程序员Espen Amble Kolstad

 

 

推荐阅读