首页 > 技术文章 > python1-python3中sort函数key如何对两个参数做对比

tensorzhang 2021-04-12 01:39 原文

  • python3之后不支持cmp,所用key函数并不直接比较任意两个原始元素,而是通过key函数把那些元素转换成一个个新的可比较对象,也就是元素的key,然后用元素的key代替元素去参与比较。如果原始元素本来就是可比较对象,比如数字、字符串,那么不考虑性能优化可以直接sort(key=lambda e: e)。不过这种基于key函数的设计倾向于每个元素的大小有个绝对标准,但有时却会出现单个元素并没有一个绝对的大小的情况,此时可以使用 functools.cmp_to_key构建基于多个元素的比较函数。

  • 以一个leetcode上的题为例:

    179. 最大数
    给定一组非负整数 nums,重新排列每个数的顺序(每个数不可拆分)使之组成一个最大的整数。
    注意:输出结果可能非常大,所以你需要返回一个字符串而不是整数。
    
    示例 1:
    输入:nums = [10,2]
    输出:"210"
    
    示例 2:
    输入:nums = [3,30,34,5,9]
    输出:"9534330"
    
    示例 3:
    输入:nums = [1]
    输出:"1"
    
    示例 4:
    输入:nums = [10]
    输出:"10"
     
    提示:
    1 <= nums.length <= 100
    0 <= nums[i] <= 109
    

    可以看到在这道题中列表nums中两个值的相对位置并不能由单一num决定,而是说 x与y拼接比y与x拼接的值大,那么就用[x,y]的顺序,否则用[y,x]的顺序。此时就是所谓的:单个元素并没有一个绝对的大小的情况

  • 要解决这道题用sort也很简单:

    from functools import cmp_to_key
    
    class Solution:
    
        def largestNumber(self, nums: List[int]) -> str:
            nums.sort(key=cmp_to_key(lambda x,y: int(str(y)+str(x)) - int(str(x)+str(y))))
            ans = ''.join([str(num) for num in nums])
            return str(int(ans))
    

    或者

    from functools import cmp_to_key
    
    def auxComp(x, y):
        if int(str(x)+str(y)) > int(str(y)+str(x)):
            return -1
        elif int(str(x)+str(y)) < int(str(y)+str(x)):
            return 1
        else:
            return 0
    
    class Solution:
    
        def largestNumber(self, nums: List[int]) -> str:
            nums.sort(key=cmp_to_key(auxComp))
            ans = ''.join([str(num) for num in nums])
            return str(int(ans))
    

    至于cmp_to_key中函数的条件可以这样理解:

    sort本身是升序,而题目要求是降序,因此需要cmp_to_key中反着写(或者加上reverse=True),也就是解法中的:

    lambda x,y: int(str(y)+str(x)) - int(str(x)+str(y))
    

    以及

    def auxComp(x, y):
        if int(str(x)+str(y)) > int(str(y)+str(x)):
            return -1
        elif int(str(x)+str(y)) < int(str(y)+str(x)):
            return 1
        else:
            return 0
    
  • 一句话说:python3中一些接受key的函数中(例如sorted,min,max,heapq.nlargest,itertools.groupby),key仅仅支持一个参数,无法实现两个参数之间的对比。采用cmp_to_key 函数,可以接受两个参数,对两个参数做处理,比如做和做差,转换成一个参数,就可以应用于key关键字了。

参考:

怎么理解Python的cmp_to_key函数?

python3 为什么取消了sort方法中的cmp参数?

一句话理解cmp_to_key函数

python sort函数内部实现原理

推荐阅读