06 哈希表

哈希表是比数组更复杂的数据结构,在某些语言里被称作关联数组或者字典等等。简单说,哈希表用于存放指定键(key)对应的值(value),键和值的关系,就像字典中单词和释义的对应关系,通过单词可以快速找到释义,而不需要从头依次遍历匹配。准确地说,哈希表只是该功能的一种实现方式,也可以使用各种树或者其他数据结构来实现,不同的实现方式适合不同的场景,使用方法是一样的。但为了简化概念,统一使用哈希表这个名称。

哈希表定义

和其他变量类型不同,哈希表是需要提前声明的,因为哈希表的赋值语法和数组一样,如果不声明,是无法区分的。

% typeset -A table
# 或者用 local,二者功能是一样的
% local -A table

# 赋值的语法和数组一样,但顺序依次是键、值、键、值
% table=(k1 v1 k2 v2)

# 直接用 echo 只能输出值
% echo $table
v1 v2

# 使用 (kv) 同时输出键和值,(kv) 会把键和值都放到同一个数组里
% echo ${(kv)table}
k1 v1 k2 v2
 
# 哈希表的大小是键值对的数量
% echo $#table
2

元素读写

读写哈希表的方法和数组类似,只是用于定位的数字变成了字符串。

# 可以声明和赋值写到一行
% local -A table=(k1 v1 k2 v2 k3 v3)
% echo $table[k2]
v2

% table[k2]="V2"

# 删除元素的方法和数组不同,引号不能省略
% unset "table[k1]"
% echo ${(kv)table}
k2 V2 k3 v3

哈希表拼接

# 追加元素的方法和数组一样
% table+=(k4 v4 k5 v5)
% echo $table
V2 v3 v4 v5


% local -A table1 table2
% table1=(k1 v1 k2 v2)
% table2=(k2 v222 k3 v3)

# 拼接哈希表,要展开成数组再追加
% table1+=(${(kv)table2})
# 如果键重复,会直接替换值,哈希表的键是不重复的
% echo ${(kv)table1}
k1 v1 k2 v222 k3 v3

哈希表遍历

(kv) (k) 等先将哈希表转化成数组,然后再遍历。

% local -A table=(k1 v1 k2 v2 k3 v3)

# 只遍历值
% for i ($table) {
> echo $i
> }
v1
v2
v3

# 只遍历键
% for i (${(k)table}) {
> echo $i
> }
k1
k2
k3

# 同时遍历键和值
% for k v (${(kv)table}) {
> echo "$k -> $v"
> }
k1 -> v1
k2 -> v2
k3 -> v3

元素查找

判断键是否存在。

% local -A table=(k1 v1 k2 v2 k3 v3)
% (($+table[k1])) && echo good
good
% (($+table[k4])) && echo good

如果需要判断某个值是否存在,直接对值的数组判断即可。但这样做就体现不出哈希表的优势了。

% local -A table=(k1 v1 k2 v2 k3 v3)
# value 是值的数组,也可以用 local -a 强行声明为数组
% value=($table)

% (( $value[(I)v1] )) && echo good
good
% (( $value[(I)v4] )) && echo good

元素排序

对哈希表元素排序的方法,和数组类似,多了 k v 两个选项,其余的选项如 o(升序)、O(降序)、n(按数字大小)、i(忽略大小写)等通用,不再一一举例。

% local -A table=(aa 33 cc 11 bb 22)

# 只对值排序
% echo ${(o)table}
11 22 33

# 只对键排序
% echo ${(ok)table}
aa bb cc

# 键值放在一起排序
% echo ${(okv)table}
11 22 33 aa bb cc

从字符串、文件构造哈希表

因为哈希表可以从数组构造,所以从字符串、文件构造哈希表,和数组的操作是一样的,不再一一举例。

% str="k1 v1 k2 v2 k3 v3"
% local -A table=(${=str})
% echo $table
v1 v2 v3

对哈希表中的每个元素统一处理

对哈希表中的每个元素统一处理,和对数组的操作是类似的,多了 k v 两个选项用于指定是对键处理还是对值处理,可以一起处理。不再一一举例。

% local -A table=(k1 v1 k2 v2 k3 v3)
% print ${(U)table}
V1 V2 V3

% print ${(Uk)table}
K1 K2 K3

% print ${(Ukv)table}
K1 V1 K2 V2 K3 V3

:# 也可以在哈希表上用。

% local -A table=(k1 v1 k2 v2 k3 v3)

# 排除匹配到的值
% echo ${table:#v1}
v2 v3

# 只输出匹配到的键
% echo ${(Mk)table:#k[1-2]}
k1 k2

多维哈希表

Zsh 并不支持多维哈希表以及多维数组,但可以通过一些方法来模拟,以实现一部分功能。

用一维哈希表模拟多维哈希表

% local -A table
# 这里用 , 作为分隔符,也可以用其他符号。
% table[1,1]=a
% table[1,2]=b
% table[k,v]=c
% echo $table[1,1] $table[1,2] $table[k,v]
a b c

好处:使用方便,而且支持的维数不受限制。

坏处:功能太单一,比如不能对 table[1] 进行处理。

用字符串分割访问来模拟多维哈希表

% local -A table
# 分隔符为空格
% table[1]='a b'
% table[2]='c d'
% print -l $table[1] ${table[1][(w)2]} ${table[2][(w)1]}
a b
b
c

# 分隔符不是空格
% table[a]='aa,bb'
% table[b]='cc,dd'
% print -l $table[a] ${table[a][(ws:,:)2]} ${table[b][(ws:,:)1]}
aa,bb
bb
cc

好处:可以对 table[1] 进行处理。

坏处:不大方便,性能也不好。而且功能同样受限,比如第一维只能是数组,不能是哈希表。可以支持更多维,但需要再增加新的分隔符,使用起来更麻烦。

总结

本篇简单讲了哈希表的基本用法。篇幅不长,但因为哈希表的操作和数组类似,很多操作数组的方法都可以用作哈希表上,而且可以把键或者值单独作为数组处理,所以操作哈希表更为复杂一些。

另外还有一些更进阶的处理数组和哈希表方法,之后会讲到。