首页 > 解决方案 > 如何按值比较两个数据框的值并忽略其他不相关的行

问题描述

如何比较数据框中两列的值并跳过两列之间不匹配的其他行,因为这些值不在同一索引位置或行上。我已经尝试了几种方法,但到目前为止都没有奏效。我想将我的第二个数据框与第一个数据框匹配,如果它们具有相同的值,即文本和真实文本列的值,当它们不同时,它应该忽略最后一个不匹配的我在下面的数据框

我有看起来像这样的数据框

       Text    occurrence   
   0    my        4       
   1    name      6       
   2    is        7       
   3    very      3
   4    popular   1
   5    last      6
   6    in        4
   7    the       2
   8    country   2

和另一个看起来像这样的数据框:

    real-text   
   0   my           
   1   name       
   2   is          
   3  very      
   4  popular      
   5   in    
   6   the      
   7  country
   

现在我想合并它们实际匹配的两个并忽略任何不匹配的行这是我到目前为止得到的但没有得到我想要的结果:

       Text   real-text  occurrence 
   0    my        my           4          
   1    name     name          6          
   2    is        is           7          
   3    very     very          3
   4    popular    popular     1
   5    last     in            6
   6    in       the           4
   7    the      country       2
   8    country    NaN         1

这是我期待的结果

       Text   real-text  occurence  
   0    my        my           4          
   1    name     name          6          
   2    is        is           7          
   3    very     very          3
   4    popular    popular     1
   6    in         in          4
   7    the        the         2
   8    country    country     1

如果您查看预期的数据框,它没有索引位置 5,这两个数据框之间没有匹配

提前感谢,因为我还是 python 新手

标签: pythonpandasdataframe

解决方案


推荐阅读