首页 > 解决方案 > 在 Scala 中,根据与另一个元素的相似性来删除列表中元素的最有效方法是什么?

问题描述

我有一长串大约 300 个对象,列表中的每个对象都具有以下数据结构:

case class MyObject(id: String,
                    name: String,
                    colour: String,
                    price: Int
                    height: Int
                    width: Int,
                    desc: String)

我无法确定浏览列表的最佳方式是什么,并且对于每个对象,删除具有相同名称、颜色、价格、高度和宽度的任何其他对象。请注意,这不是简单的重复数据删除,因为 ids 和 desc 可能不同。输入和输出需要保留List[MyObject],我事先不知道哪些对象是重复的。

这是我最初的有效解决方案,但不确定在处理大型列表时它是最有效的方法。

def removeDuplicates(originalList: List[MyObject]): List[MyObject] = {

  def loop(remaining: List[MyObject], acc: List[MyObject]): List[MyObject] = {
    remaining match {
      case head :: tail =>
        val listOfDuplicates = tail.filter{ x =>
          x.name == head.name &&
          x.colour == head.colour &&
          x.price == head.price &&
          x.height == head.height &&
          x.width == head.width
        }

        val deDupedTail = tail.filter(!listOfDuplicates.contains(_))

        loop(deDupedTail, acc ::: listOfDuplicates)
      case Nil => acc
    }
  }
  val listOfDuplicateObjects = loop(originalList, List())
  originalList.filter(!listOfDuplicateObjects.contains(_))
}

标签: listscalaloopsfilter

解决方案


不确定它是否最有效,但恕我直言,它很优雅:

originalList.distinctBy(o => (o.name, o.colour, o.price, o.height, o.width))

推荐阅读