EXISTS、IN 与 JOIN,都可以用来实现形如 “查询 A 表中在 (或不在) B 表中的记录” 的查询逻辑。
在查询的两个表大小相当的情况下,3 种查询方式的执行时间通常是:
EXISTS <= IN <= JOINNOT
EXISTS <= NOT IN <= LEFT JOIN
只有当表中字段允许 NULL 时,NOT IN 的方式最慢:
NOT EXISTS <= LEFT JOIN <= NOT IN
但是如果两个表中一个较小,一个较大,则子查询表大的用 exists,子查询表小的用 in,因为 in 是把外表和内表作 hash 连接,而 exists 是对外表作 loop 循环,每次 loop 循环再对内表进行查询。而无论那个表大,用 not exists 都比 not in 要快。这是因为如果查询语句使用了 not in 那么内外表都进行全表扫描,没有用到索引;而 not extsts 的子查询依然能用到表上的索引。IN 的好处是逻辑直观简单 (通常是独立子查询); 缺点是只能判断单字段,并且当 NOT IN 时效率较低,而且 NULL 会导致不想要的结果。EXISTS 的好处是效率高,可以判断单字段和组合字段,并不受 NULL 的影响;缺点是逻辑稍微复杂 (通常是相关子查询)。JOIN 用在这种场合,往往是吃力不讨好。JOIN 的用途是联接两个表,而不是判断一个表的记录是否在另一个表。
网友评论