python - 设置差异运算符不采取差异(似乎什么都不做)?
问题描述
尝试set
在 python 中做一个简单的差异,并获得表明差异运算符什么都不做的结果。例如。有代码
蟒蛇版本 2.7.15+
assert isinstance(left_frame, h2o.H2OFrame)
assert isinstance(right_frame, h2o.H2OFrame)
assert isinstance(left_key, str)
assert isinstance(right_key, str)
# ensure that the primary_key exists in both frames
assert left_key in left_frame.columns, 'left_key: {} does not exist in left_frame'.format(left_key)
assert right_key in right_frame.columns, 'right_key: {} does not exist in right_frame'.format(right_key)
# ensure that the primary_key is the only common column between the left and right frame
left_non_pk_cols = set(left_frame.columns) - set(left_key)
assert left_on not in left_non_pk_cols, '%s' % left_key
right_non_pk_cols = set(right_frame.columns) - set(right_key)
assert right_on not in right_non_pk_cols, '%s' % right_key
left_non_pk_cols_in_right = left_non_pk_cols.intersection(right_non_pk_cols)
assert len(left_non_pk_cols_in_right) == 0,\
'The primary_key is not the only common column between frames, h2o merge will not work as expected\n%s\n%s\n%s' \
% (left_non_pk_cols, right_non_pk_cols, left_non_pk_cols_in_right)
我得到错误
assert left_key not in left_non_pk_cols, '%s' % left_key
AssertionError: <the left_key value>
这对我来说真的很奇怪。在终端(具有相同的 python 版本)中运行一个简化的示例案例
assert u'1' not in (set([u'1', u'2', u'3']) - set(u'1'))
# noting that the H2OFrames `.columns` field is a list of unicode strings
根本不抛出任何错误并按预期完成(打印结果时set
,一切看起来都应该(无u'1'
元素))。
使用.difference()
方法而不是-
运算符也不会产生任何差异。
有谁知道这里会发生什么或做其他事情来获取更多调试信息?
解决方案
to 的参数set()
是一个可迭代对象,它创建了一个可迭代对象的每个元素的集合。所以如果left_key
是一个字符串,set(left_key)
将创建一个字符串的每个唯一字符的集合,而不是一个元素是字符串的集合。
解决方案是使用set([left_key])
. 参数将是列表,然后集合将包含其单个元素,即字符串。或者你可以只使用一个集合文字{left_key}
left_non_pk_cols = set(left_frame.columns) - {left_key}
另一种方法是从集合中删除元素。
left_non_pk_cols = set(left_frame.columns)
left_non_pk.cols.discard(left_key)
我使用discard
而不是remove
因为如果找不到元素,它不会发出错误信号。
推荐阅读
- node.js - 从节点流式传输并在 javascript 客户端上生成 blob 的文件要大得多且已损坏
- excel - 根据第一行中的值选择列并将这些列复制到另一个工作表
- javascript - 使用 JS 同时应用 Hue-Rotation、Saturation 和 Lightness Filters
- docker - redis-sentinel 日志被 +sentinel-address-switch 和 +sentinel-address-update 淹没
- c# - PowerShell:.NET 程序集的 Import-Module 或 Add-Type?
- python - 如何在python中获取一行字典
- yaml - serverless.yml 文件中打包作业的使用
- javascript - 在类创建的对象上返回未定义
- sql - 交叉表查询 - 记录消失
- python - Python - 模拟 ZipFile