Convert newlines to spaces in names written in v11+ pg_dump comments.
authorNoah Misch <noah@leadboat.com>
Mon, 11 Aug 2025 13:18:59 +0000 (06:18 -0700)
committerNoah Misch <noah@leadboat.com>
Mon, 11 Aug 2025 13:19:04 +0000 (06:19 -0700)
Maliciously-crafted object names could achieve SQL injection during
restore.  CVE-2012-0868 fixed this class of problem at the time, but
later work reintroduced three cases.  Commit
bc8cd50fefd369b217f80078585c486505aafb62 (back-patched to v11+ in
2023-05 releases) introduced the pg_dump case.  Commit
6cbdbd9e8d8f2986fde44f2431ed8d0c8fce7f5d (v12+) introduced the two
pg_dumpall cases.  Move sanitize_line(), unchanged, to dumputils.c so
pg_dumpall has access to it in all supported versions.  Back-patch to
v13 (all supported versions).

Reviewed-by: Robert Haas <robertmhaas@gmail.com>
Reviewed-by: Nathan Bossart <nathandbossart@gmail.com>
Backpatch-through: 13
Security: CVE-2025-8715

src/bin/pg_dump/dumputils.c
src/bin/pg_dump/dumputils.h
src/bin/pg_dump/pg_backup_archiver.c
src/bin/pg_dump/pg_dump.c
src/bin/pg_dump/pg_dumpall.c
src/bin/pg_dump/t/002_pg_dump.pl
src/bin/pg_dump/t/003_pg_dump_with_server.pl

index 3e68dfc78f9d95c5a66feb32b08ef142574f5521..7657e426818b8755c26c8b2cee071bf1d2c256d4 100644 (file)
@@ -29,6 +29,43 @@ static void AddAcl(PQExpBuffer aclbuf, const char *keyword,
                   const char *subname);
 
 
+/*
+ * Sanitize a string to be included in an SQL comment or TOC listing, by
+ * replacing any newlines with spaces.  This ensures each logical output line
+ * is in fact one physical output line, to prevent corruption of the dump
+ * (which could, in the worst case, present an SQL injection vulnerability
+ * if someone were to incautiously load a dump containing objects with
+ * maliciously crafted names).
+ *
+ * The result is a freshly malloc'd string.  If the input string is NULL,
+ * return a malloc'ed empty string, unless want_hyphen, in which case return a
+ * malloc'ed hyphen.
+ *
+ * Note that we currently don't bother to quote names, meaning that the name
+ * fields aren't automatically parseable.  "pg_restore -L" doesn't care because
+ * it only examines the dumpId field, but someday we might want to try harder.
+ */
+char *
+sanitize_line(const char *str, bool want_hyphen)
+{
+   char       *result;
+   char       *s;
+
+   if (!str)
+       return pg_strdup(want_hyphen ? "-" : "");
+
+   result = pg_strdup(str);
+
+   for (s = result; *s != '\0'; s++)
+   {
+       if (*s == '\n' || *s == '\r')
+           *s = ' ';
+   }
+
+   return result;
+}
+
+
 /*
  * Build GRANT/REVOKE command(s) for an object.
  *
index c67c3b5b842d9755574a0d2e210f8cc6279f48ff..1716b6d0d83daccbf6ecdadad6fdfc702eddc535 100644 (file)
@@ -36,6 +36,7 @@
 #endif
 
 
+extern char *sanitize_line(const char *str, bool want_hyphen);
 extern bool buildACLCommands(const char *name, const char *subname, const char *nspname,
                             const char *type, const char *acls, const char *baseacls,
                             const char *owner, const char *prefix, int remoteVersion,
index 55b24f1837f598b4737b5f4d75f8c4b168ab0b01..ae84f4062896f2bf578c077dcd6fbddfe2713d61 100644 (file)
@@ -74,7 +74,6 @@ static ArchiveHandle *_allocAH(const char *FileSpec, const ArchiveFormat fmt,
                               SetupWorkerPtrType setupWorkerPtr);
 static void _getObjectDescription(PQExpBuffer buf, TocEntry *te);
 static void _printTocEntry(ArchiveHandle *AH, TocEntry *te, bool isData);
-static char *sanitize_line(const char *str, bool want_hyphen);
 static void _doSetFixedOutputState(ArchiveHandle *AH);
 static void _doSetSessionAuth(ArchiveHandle *AH, const char *user);
 static void _reconnectToDB(ArchiveHandle *AH, const char *dbname);
@@ -3747,42 +3746,6 @@ _printTocEntry(ArchiveHandle *AH, TocEntry *te, bool isData)
    }
 }
 
-/*
- * Sanitize a string to be included in an SQL comment or TOC listing, by
- * replacing any newlines with spaces.  This ensures each logical output line
- * is in fact one physical output line, to prevent corruption of the dump
- * (which could, in the worst case, present an SQL injection vulnerability
- * if someone were to incautiously load a dump containing objects with
- * maliciously crafted names).
- *
- * The result is a freshly malloc'd string.  If the input string is NULL,
- * return a malloc'ed empty string, unless want_hyphen, in which case return a
- * malloc'ed hyphen.
- *
- * Note that we currently don't bother to quote names, meaning that the name
- * fields aren't automatically parseable.  "pg_restore -L" doesn't care because
- * it only examines the dumpId field, but someday we might want to try harder.
- */
-static char *
-sanitize_line(const char *str, bool want_hyphen)
-{
-   char       *result;
-   char       *s;
-
-   if (!str)
-       return pg_strdup(want_hyphen ? "-" : "");
-
-   result = pg_strdup(str);
-
-   for (s = result; *s != '\0'; s++)
-   {
-       if (*s == '\n' || *s == '\r')
-           *s = ' ';
-   }
-
-   return result;
-}
-
 /*
  * Write the file header for a custom-format archive
  */
index 54f07b9d0da40b22969a1d3265c717e740ce8ed3..e9e2267b813bd554428f3b5f600954d866385b6c 100644 (file)
@@ -2513,11 +2513,14 @@ dumpTableData(Archive *fout, const TableDataInfo *tdinfo)
         forcePartitionRootLoad(tbinfo)))
    {
        TableInfo  *parentTbinfo;
+       char       *sanitized;
 
        parentTbinfo = getRootTableInfo(tbinfo);
        copyFrom = fmtQualifiedDumpable(parentTbinfo);
+       sanitized = sanitize_line(copyFrom, true);
        printfPQExpBuffer(copyBuf, "-- load via partition root %s",
-                         copyFrom);
+                         sanitized);
+       free(sanitized);
        tdDefn = pg_strdup(copyBuf->data);
    }
    else
index eec820de49ee22d55cc7263a1077710639437004..254c7736baaefa1404e2c3badec9384b0008b1eb 100644 (file)
@@ -1254,7 +1254,13 @@ dumpUserConfig(PGconn *conn, const char *username)
    res = executeQuery(conn, buf->data);
 
    if (PQntuples(res) > 0)
-       fprintf(OPF, "\n--\n-- User Config \"%s\"\n--\n\n", username);
+   {
+       char       *sanitized;
+
+       sanitized = sanitize_line(username, true);
+       fprintf(OPF, "\n--\n-- User Config \"%s\"\n--\n\n", sanitized);
+       free(sanitized);
+   }
 
    for (int i = 0; i < PQntuples(res); i++)
    {
@@ -1356,6 +1362,7 @@ dumpDatabases(PGconn *conn)
    for (i = 0; i < PQntuples(res); i++)
    {
        char       *dbname = PQgetvalue(res, i, 0);
+       char       *sanitized;
        const char *create_opts;
        int         ret;
 
@@ -1372,7 +1379,9 @@ dumpDatabases(PGconn *conn)
 
        pg_log_info("dumping database \"%s\"", dbname);
 
-       fprintf(OPF, "--\n-- Database \"%s\" dump\n--\n\n", dbname);
+       sanitized = sanitize_line(dbname, true);
+       fprintf(OPF, "--\n-- Database \"%s\" dump\n--\n\n", sanitized);
+       free(sanitized);
 
        /*
         * We assume that "template1" and "postgres" already exist in the
index d012b748ffce4c0892d3176f22c6eb3c8b64b7f4..bd4212d1e2d41d479dc679f06a07ddc24b674d68 100644 (file)
@@ -1575,6 +1575,27 @@ my %tests = (
        },
    },
 
+   'newline of role or table name in comment' => {
+       create_sql => qq{CREATE ROLE regress_newline;
+                        ALTER ROLE regress_newline SET enable_seqscan = off;
+                        ALTER ROLE regress_newline
+                           RENAME TO "regress_newline\nattack";
+
+                        -- meet getPartitioningInfo() "unsafe" condition
+                        CREATE TYPE pp_colors AS
+                           ENUM ('green', 'blue', 'black');
+                        CREATE TABLE pp_enumpart (a pp_colors)
+                           PARTITION BY HASH (a);
+                        CREATE TABLE pp_enumpart1 PARTITION OF pp_enumpart
+                           FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+                        CREATE TABLE pp_enumpart2 PARTITION OF pp_enumpart
+                           FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+                        ALTER TABLE pp_enumpart
+                           RENAME TO "pp_enumpart\nattack";},
+       regexp => qr/\n--[^\n]*\nattack/s,
+       like => {},
+   },
+
    'CREATE DATABASE regression_invalid...' => {
        create_order => 1,
        create_sql => q(
index 8cc9da06599100ddcf8db49e4a451d6c01f2de6c..416d6f76f5e0c1c74728c2d50e325565314b51fa 100644 (file)
@@ -16,6 +16,22 @@ my $port = $node->port;
 $node->init;
 $node->start;
 
+#########################################
+# pg_dumpall: newline in database name
+
+$node->safe_psql('postgres', qq{CREATE DATABASE "regress_\nattack"});
+
+my (@cmd, $stdout, $stderr);
+@cmd = ("pg_dumpall", '--port' => $port, '--exclude-database=postgres');
+print("# Running: " . join(" ", @cmd) . "\n");
+my $result = IPC::Run::run \@cmd, '>' => \$stdout, '2>' => \$stderr;
+ok(!$result, "newline in dbname: exit code not 0");
+like(
+   $stderr,
+   qr/shell command argument contains a newline/,
+   "newline in dbname: stderr matches");
+unlike($stdout, qr/^attack/m, "newline in dbname: no comment escape");
+
 #########################################
 # Verify that dumping foreign data includes only foreign tables of
 # matching servers
@@ -26,7 +42,6 @@ $node->safe_psql('postgres', "CREATE SERVER s1 FOREIGN DATA WRAPPER dummy");
 $node->safe_psql('postgres', "CREATE SERVER s2 FOREIGN DATA WRAPPER dummy");
 $node->safe_psql('postgres', "CREATE FOREIGN TABLE t0 (a int) SERVER s0");
 $node->safe_psql('postgres', "CREATE FOREIGN TABLE t1 (a int) SERVER s1");
-my ($cmd, $stdout, $stderr, $result);
 
 command_fails_like(
    [ "pg_dump", '-p', $port, '--include-foreign-data=s0', 'postgres' ],