Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Dissociate btequalimage() from interval_ops, ending its deduplication.
authorNoah Misch <noah@leadboat.com>
Sat, 14 Oct 2023 23:33:51 +0000 (16:33 -0700)
committerNoah Misch <noah@leadboat.com>
Sat, 14 Oct 2023 23:33:54 +0000 (16:33 -0700)
Under interval_ops, some equal values are distinguishable.  One such
pair is '24:00:00' and '1 day'.  With that being so, btequalimage()
breaches the documented contract for the "equalimage" btree support
function.  This can cause incorrect results from index-only scans.
Users should REINDEX any btree indexes having interval-type columns.
After updating, pg_amcheck will report an error for almost all such
indexes.  This fix makes interval_ops simply omit the support function,
like numeric_ops does.  Back-pack to v13, where btequalimage() first
appeared.  In back branches, for the benefit of old catalog content,
btequalimage() code will return false for type "interval".  Going
forward, back-branch initdb will include the catalog change.

Reviewed by Peter Geoghegan.

Discussion: https://postgr.es/m/20231011013317.22.nmisch@google.com

contrib/amcheck/verify_nbtree.c
src/backend/utils/adt/datum.c
src/include/catalog/pg_amproc.dat
src/include/catalog/pg_opfamily.dat
src/test/regress/expected/opr_sanity.out

index 2beeebb1635313794c8726519f796d2dc3bc79b2..1c2ed981ad55418fd50768d7372efb1f20e5c69d 100644 (file)
@@ -31,6 +31,7 @@
 #include "access/xact.h"
 #include "catalog/index.h"
 #include "catalog/pg_am.h"
+#include "catalog/pg_opfamily_d.h"
 #include "commands/tablecmds.h"
 #include "common/pg_prng.h"
 #include "lib/bloomfilter.h"
@@ -337,10 +338,20 @@ bt_index_check_internal(Oid indrelid, bool parentcheck, bool heapallindexed,
                     errmsg("index \"%s\" metapage has equalimage field set on unsupported nbtree version",
                            RelationGetRelationName(indrel))));
        if (allequalimage && !_bt_allequalimage(indrel, false))
+       {
+           bool        has_interval_ops = false;
+
+           for (int i = 0; i < IndexRelationGetNumberOfKeyAttributes(indrel); i++)
+               if (indrel->rd_opfamily[i] == INTERVAL_BTREE_FAM_OID)
+                   has_interval_ops = true;
            ereport(ERROR,
                    (errcode(ERRCODE_INDEX_CORRUPTED),
                     errmsg("index \"%s\" metapage incorrectly indicates that deduplication is safe",
-                           RelationGetRelationName(indrel))));
+                           RelationGetRelationName(indrel)),
+                    has_interval_ops
+                    ? errhint("This is known of \"interval\" indexes last built on a version predating 2023-11.")
+                    : 0));
+       }
 
        /* Check index, possibly against table it is an index on */
        bt_check_every_level(indrel, heaprel, heapkeyspace, parentcheck,
index 7070da1762d5ba3660dae0210c819b1e3154e888..f421024c89aae233717578e6768b87776a73bc88 100644 (file)
@@ -43,6 +43,7 @@
 #include "postgres.h"
 
 #include "access/detoast.h"
+#include "catalog/pg_type_d.h"
 #include "common/hashfn.h"
 #include "fmgr.h"
 #include "utils/builtins.h"
@@ -385,20 +386,17 @@ datum_image_hash(Datum value, bool typByVal, int typLen)
  * datum_image_eq() in all cases can use this as their "equalimage" support
  * function.
  *
- * Currently, we unconditionally assume that any B-Tree operator class that
- * registers btequalimage as its support function 4 must be able to safely use
- * optimizations like deduplication (i.e. we return true unconditionally).  If
- * it ever proved necessary to rescind support for an operator class, we could
- * do that in a targeted fashion by doing something with the opcintype
- * argument.
+ * Earlier minor releases erroneously associated this function with
+ * interval_ops.  Detect that case to rescind deduplication support, without
+ * requiring initdb.
  *-------------------------------------------------------------------------
  */
 Datum
 btequalimage(PG_FUNCTION_ARGS)
 {
-   /* Oid      opcintype = PG_GETARG_OID(0); */
+   Oid         opcintype = PG_GETARG_OID(0);
 
-   PG_RETURN_BOOL(true);
+   PG_RETURN_BOOL(opcintype != INTERVALOID);
 }
 
 /*-------------------------------------------------------------------------
index 4cc129bebd8361b8cadb6a6d2bf040e31aad7f72..135caee63363036a6c402a0f44bd2fae391fae65 100644 (file)
 { amprocfamily => 'btree/interval_ops', amproclefttype => 'interval',
   amprocrighttype => 'interval', amprocnum => '3',
   amproc => 'in_range(interval,interval,interval,bool,bool)' },
-{ amprocfamily => 'btree/interval_ops', amproclefttype => 'interval',
-  amprocrighttype => 'interval', amprocnum => '4', amproc => 'btequalimage' },
 { amprocfamily => 'btree/macaddr_ops', amproclefttype => 'macaddr',
   amprocrighttype => 'macaddr', amprocnum => '1', amproc => 'macaddr_cmp' },
 { amprocfamily => 'btree/macaddr_ops', amproclefttype => 'macaddr',
index b3b6a7e616a9e78fe32e448cacce859f8296cce3..f2eaa9b2b891172cebef7d9a222941c9e7be8151 100644 (file)
@@ -50,7 +50,7 @@
   opfmethod => 'btree', opfname => 'integer_ops' },
 { oid => '1977',
   opfmethod => 'hash', opfname => 'integer_ops' },
-{ oid => '1982',
+{ oid => '1982', oid_symbol => 'INTERVAL_BTREE_FAM_OID',
   opfmethod => 'btree', opfname => 'interval_ops' },
 { oid => '1983',
   opfmethod => 'hash', opfname => 'interval_ops' },
index 330eb0f7656bf6fdfb2bf10410c1c3d7b29a760f..f27217c52d1eb02a0935be11f401764c401e87a0 100644 (file)
@@ -2175,6 +2175,7 @@ ORDER BY 1, 2, 3;
                     | array_ops        | array_ops        | anyarray
                     | float_ops        | float4_ops       | real
                     | float_ops        | float8_ops       | double precision
+                    | interval_ops     | interval_ops     | interval
                     | jsonb_ops        | jsonb_ops        | jsonb
                     | multirange_ops   | multirange_ops   | anymultirange
                     | numeric_ops      | numeric_ops      | numeric
@@ -2183,7 +2184,7 @@ ORDER BY 1, 2, 3;
                     | record_ops       | record_ops       | record
                     | tsquery_ops      | tsquery_ops      | tsquery
                     | tsvector_ops     | tsvector_ops     | tsvector
-(15 rows)
+(16 rows)
 
 -- **************** pg_index ****************
 -- Look for illegal values in pg_index fields.