Request XLOG switch before writing checkpoint in pg_start_backup(). Otherwise
authorHeikki Linnakangas <heikki@enterprisedb.com>
Thu, 7 May 2009 11:25:25 +0000 (11:25 +0000)
committerHeikki Linnakangas <heikki@enterprisedb.com>
Thu, 7 May 2009 11:25:25 +0000 (11:25 +0000)
commit88259b3483bd6d8fee14ef5429b0ce07aa549b25
tree8e4916c94a82208f1710b97b5251ff38a340dda9
parent86a4abb3a187bf2cc548aedd58125274ac724b1c
Request XLOG switch before writing checkpoint in pg_start_backup(). Otherwise
you can end up with an unrecoverable backup if you start a new base backup
right after finishing archive recovery. In that scenario, the redo pointer of
the checkpoint that pg_start_backup() writes points to the XLOG segment where
the timeline-changing end-of-archive-recovery checkpoint is. The beginning
of that segment contains pages with the old timeline ID, and we don't accept
that in recovery unless we find a history file covering the old timeline ID.
If you omit pg_xlog from the base backup and clear the archive directory
before starting the backup, there will be no such history file available.

The bug is present in all versions since PITR was introduced in 8.0, but I'm
back-patching only back to 8.2. Earlier versions didn't have XLOG switch
records, making this fix unfeasible. Given the lack of reports until now,
it doesn't seem worthwhile to spend more effort to fix 8.0 and 8.1.

Per report and suggestion by Mikael Krantz
src/backend/access/transam/xlog.c