Python进阶编程:编写更高效、优雅的Python代码
上QQ阅读APP看书,第一时间看更新

3.2.8 字典合并

对于序列来说,合并操作是比较简单的。对于字典来说,为便于更好地操作,我们有时需要将多个字典从逻辑上合并为一个单一映射,比如查找值或者检查某些键是否存在。

以下为两个字典示例:


a_dict = {'x': 1, 'z': 3 }
b_dict = {'y': 2, 'z': 4 }

现在假设必须在两个字典中执行查找操作(比如,先从a_dict中找,如果找不到再在b_dict中找)。一个非常简单的解决方案是使用collections模块中的ChainMap类,代码如下:


from collections import ChainMap
c_dict = ChainMap(a_dict, b_dict)
# Outputs 1 (from a_dict)
print(c_dict['x'])
# Outputs 2 (from b_dict)
print(c_dict['y'])
# Outputs 3 (from a_dict)
print(c_dict['z'])

ChainMap类可接收多个字典,并将它们在逻辑上变为一个字典。不过,这些字典并不是真合并在一起了,ChainMap类只是在内部创建了一个容纳这些字典的列表并重新定义了一些常见的字典操作来遍历这个列表。在列表中,大部分字典操作是可以正常使用的,输出示例如下:


print(len(c_dict))
print(list(c_dict.keys()))
print(list(c_dict.values()))

如果出现重复键,那么第一次出现的映射值会被返回。因此,上述例子程序中的c_dict['z']总是会返回字典a_dict中对应的值,而不是b_dict中对应的值。

字典的更新或删除操作总是影响列表中的第一个字典,示例如下:


c_dict['z'] = 10
c_dict['w'] = 40
del c_dict['x']
print(a_dict)
del c_dict['y']

ChainMap类对编程语言中的作用范围变量(如globals、locals等)是非常有用的。以下方法可以使ChainMap的使用变得简单(merge_dict_exp.py):


val_dict = ChainMap()
val_dict['x'] = 1

val_dict = val_dict.new_child()
val_dict['x'] = 2

val_dict = val_dict.new_child()
val_dict['x'] = 3
print(val_dict)
print(val_dict['x'])

val_dict = val_dict.parents
print(val_dict['x'])

val_dict = val_dict.parents
print(val_dict['x'])

print(val_dict)

作为ChainMap类的替代,update()方法也可以实现将两个字典合并,示例如下:


a_dict = {'x': 1, 'z': 3 }
b_dict = {'y': 2, 'z': 4 }

dict_merge = dict(b_dict)
dict_merge.update(a_dict)
print(dict_merge['x'])
print(dict_merge['y'])
print(dict_merge['z'])

这样也能行得通,但是它需要创建一个完全不同的字典对象(或者是破坏现有字典结构)。如果原字典做了更新,这种改变不会反映到新的合并字典中,示例如下:


a_dict['x'] = 10
print(dict_merge['x'])

ChainMap类使用的是原来的字典,自己不创建新的字典。所以,它并不会产生上面所说的结果,示例如下:


chain_dict = ChainMap(a_dict, b_dict)
print(chain_dict['x'])

a_dict['x'] = 20
print(chain_dict['x'])