Fix right-anti-joins when the inner relation is proven unique
authorRichard Guo <rguo@postgresql.org>
Mon, 8 Jul 2024 01:11:46 +0000 (10:11 +0900)
committerRichard Guo <rguo@postgresql.org>
Mon, 8 Jul 2024 01:11:46 +0000 (10:11 +0900)
commit0ffc0acaf3bf301ba8fd43dc0e004b8b7c9ecd3a
tree184b1f42aed4c529f96aabc623bb3a4dbe94c8a0
parent74b8e6a698025fbea5a5e22ea09d07d97188c1d6
Fix right-anti-joins when the inner relation is proven unique

For an inner_unique join, we always assume that the executor will stop
scanning for matches after the first match.  Therefore, for a mergejoin
that is inner_unique and whose mergeclauses are sufficient to identify a
match, we set the skip_mark_restore flag to true, indicating that the
executor need not do mark/restore calls.  However, merge-right-anti-join
did not get this memo and continues scanning the inner side for matches
after the first match.  If there are duplicates in the outer scan, we
may incorrectly skip matching some inner tuples, which can lead to wrong
results.

Here we fix this issue by ensuring that merge-right-anti-join also
advances to next outer tuple after the first match in inner_unique
cases.  This also saves cycles by avoiding unnecessary scanning of inner
tuples after the first match.

Although hash-right-anti-join does not suffer from this wrong results
issue, we apply the same change to it as well, to help save cycles for
the same reason.

Per bug #18522 from Antti Lampinen, and bug #18526 from Feliphe Pozzer.
Back-patch to v16 where right-anti-join was introduced.

Author: Richard Guo
Discussion: https://postgr.es/m/18522-c7a8956126afdfd0@postgresql.org
src/backend/executor/nodeHashjoin.c
src/backend/executor/nodeMergejoin.c
src/test/regress/expected/join.out
src/test/regress/sql/join.sql