首页 > 解决方案 > 快速比较列表与自身

问题描述

我的数据库中有一个巨大的列表(100k 条目)。每个条目都包含一个 ID、文本和一个日期。

我创建了一个函数来尽可能地比较两个文本。现在不需要它的样子。

有没有一种“好”的方法可以通过文本从列表中删除“重复”(尽可能)?目前,我正在遍历列表两次,并将每个条目与每个条目进行比较,除了自身之外的 id。

标签: performancecomparison

解决方案


如果您的问题是当您在表中插入一行时......您可以包含唯一约束。

Postgresql CREATE TABLE table1 ( id serial PRIMARY KEY, txt VARCHAR (50), dt timestamp, UNIQUE(txt) );

Oracle CREATE TABLE table1 ( id numeric(10) NOT NULL, txt varchar2(50) NOT NULL, 日期时间戳, CONSTRAINT txt_unique UNIQUE (txt) );


推荐阅读