首页 > 解决方案 > 使用 MATLAB 查找大向量的交集

问题描述

如何在 MATLAB 中比较两个信号以找到它们的交集?我的信号是可以包含重复值的大向量。

我一直在尝试使用以下方法intersect,该方法适用于随机生成的信号。

% Example case
sig1 = rand(100,1);
sig2 = [sig1(end-10:end); rand(90,1)]; % a signal with imposed intersection.
[c, ia, ib] = intersect(sig1, sig2);
plot(sig2)
hold on
scatter(ib, sig2(ib), 'filled')
hold off

我将这种方法用于我的真实数据,但它不会产生正确的交集,这是由于信号中的重复值。所以,我想为两个信号添加一个非常小的随机噪声,然后应用intersect,但是,添加阈值是不可能的intersect

有人能给我一些关于如何稳健有效地找到两个大信号测量的交集的提示吗?还有其他方法吗?先感谢您。

背景:

我实际上有几个大的录音,, sig1, sig2, sig3.... 每两个连续的录音,例如,sig1并且sig2可能有重叠,这意味着录音的结尾sig1可能与开头完全相同sig2。所以,我的目标是检查是否有任何重叠,检测它们,然后删除它们以便能够连接所有测量值:sig1, sig2, sig3, ...

我也知道这些录音的顺序,所以交集可以被认为是sig1(end-N:end) = sig2(1:N+1)

标签: matlabsignalsvectorizationintersection

解决方案


典型的方法是互相关(信号处理工具箱有这个功能xcorr)。互相关的峰值表示两个信号最相似的延迟。这就是您需要找出两个信号重叠的程度。

因为您想将一个信号的尾部与另一个信号的头部进行比较,所以我们将只对信号的这些部分应用互相关。这确实需要知道重叠可以有多大(一些上限),这并不理想。如果我们计算互相关的裁剪部分太短(即不包含完全重叠),那么计算的移位将不正确。如果它太长、太长,互相关可能无法识别右移(峰值可能隐藏在噪声中)。也许其他人可以采用这个想法并从中构建更强大的东西......

(我没有安装信号处理工具箱,所以我使用fftandifft来实现它)

% Two example signals
sig1 = rand(100,1);
sig2 = [sig1(end-10:end); rand(90,1)];

% Take the end of sig1 and the start of sig2
N = 15; % should be larger than the overlap
end1 = sig1(end-N+1:end);
start2 = sig2(1:N);

% Compute cross-correlation
xc = ifft(fft(end1).*conj(fft(start2)));

% Find peak
[~,shift] = max(xc);

% Crop signal #2
Nrep = N-shift+1
sig2_cropped = sig2(Nrep+1:end);

% Plot
clf
subplot(2,1,1)
plot(sig1)
hold on
plot(numel(sig1)-Nrep+1:numel(sig1),sig1(end-Nrep+1:end),'r.')
subplot(2,1,2)
plot(sig2)
hold on
plot(1:Nrep,sig2(1:Nrep),'r.')

一个可能更健壮但比上述更慢的快速而肮脏的替代方案是在循环中实现比较:

Nrep = 0;
for N = 1:min(numel(sig2),numel(sig1))
   % Take the end of sig1 and the start of sig2
   end1 = sig1(end-N+1:end);
   start2 = sig2(1:N);
   % Compare
   if all(end1==start2) % possibly do this with a tolerance
      Nrep = N;
      break
   end
end

在这里,我们开始与 1 个样本的重叠进行比较,并逐个增加,直到找到匹配项。如果不匹配Nrep==0,则不重复任何样本。


推荐阅读