btree.h
上传用户:romrleung
上传日期:2022-05-23
资源大小:18897k
文件大小:11k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /*-
  2.  * See the file LICENSE for redistribution information.
  3.  *
  4.  * Copyright (c) 1996-2002
  5.  * Sleepycat Software.  All rights reserved.
  6.  */
  7. /*
  8.  * Copyright (c) 1990, 1993, 1994, 1995, 1996
  9.  * Keith Bostic.  All rights reserved.
  10.  */
  11. /*
  12.  * Copyright (c) 1990, 1993, 1994, 1995
  13.  * The Regents of the University of California.  All rights reserved.
  14.  *
  15.  * This code is derived from software contributed to Berkeley by
  16.  * Mike Olson.
  17.  *
  18.  * Redistribution and use in source and binary forms, with or without
  19.  * modification, are permitted provided that the following conditions
  20.  * are met:
  21.  * 1. Redistributions of source code must retain the above copyright
  22.  *    notice, this list of conditions and the following disclaimer.
  23.  * 2. Redistributions in binary form must reproduce the above copyright
  24.  *    notice, this list of conditions and the following disclaimer in the
  25.  *    documentation and/or other materials provided with the distribution.
  26.  * 3. Neither the name of the University nor the names of its contributors
  27.  *    may be used to endorse or promote products derived from this software
  28.  *    without specific prior written permission.
  29.  *
  30.  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
  31.  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
  32.  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
  33.  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
  34.  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
  35.  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
  36.  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
  37.  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
  38.  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
  39.  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
  40.  * SUCH DAMAGE.
  41.  *
  42.  * $Id: btree.h,v 11.45 2002/08/06 06:11:21 bostic Exp $
  43.  */
  44. #ifndef _DB_BTREE_H_
  45. #define _DB_BTREE_H_
  46. /* Forward structure declarations. */
  47. struct __btree; typedef struct __btree BTREE;
  48. struct __cursor; typedef struct __cursor BTREE_CURSOR;
  49. struct __epg; typedef struct __epg EPG;
  50. struct __recno; typedef struct __recno RECNO;
  51. #define DEFMINKEYPAGE  (2)
  52. /*
  53.  * A recno order of 0 indicates that we don't have an order, not that we've
  54.  * an order less than 1.
  55.  */
  56. #define INVALID_ORDER 0
  57. #define ISINTERNAL(p) (TYPE(p) == P_IBTREE || TYPE(p) == P_IRECNO)
  58. #define ISLEAF(p) (TYPE(p) == P_LBTREE ||
  59.     TYPE(p) == P_LRECNO || TYPE(p) == P_LDUP)
  60. /* Flags for __bam_cadjust_log(). */
  61. #define CAD_UPDATEROOT 0x01 /* Root page count was updated. */
  62. /* Flags for __bam_split_log(). */
  63. #define SPL_NRECS 0x01 /* Split tree has record count. */
  64. /* Flags for __bam_iitem(). */
  65. #define BI_DELETED 0x01 /* Key/data pair only placeholder. */
  66. /* Flags for __bam_stkrel(). */
  67. #define STK_CLRDBC 0x01 /* Clear dbc->page reference. */
  68. #define STK_NOLOCK 0x02 /* Don't retain locks. */
  69. /* Flags for __ram_ca(). These get logged, so make the values explicit. */
  70. typedef enum {
  71. CA_DELETE = 0, /* Delete the current record. */
  72. CA_IAFTER = 1, /* Insert before the current record. */
  73. CA_IBEFORE = 2, /* Insert after the current record. */
  74. CA_ICURRENT = 3 /* Overwrite the current record. */
  75. } ca_recno_arg;
  76. /*
  77.  * Flags for __bam_search() and __bam_rsearch().
  78.  *
  79.  * Note, internal page searches must find the largest record less than key in
  80.  * the tree so that descents work.  Leaf page searches must find the smallest
  81.  * record greater than key so that the returned index is the record's correct
  82.  * position for insertion.
  83.  *
  84.  * The flags parameter to the search routines describes three aspects of the
  85.  * search: the type of locking required (including if we're locking a pair of
  86.  * pages), the item to return in the presence of duplicates and whether or not
  87.  * to return deleted entries.  To simplify both the mnemonic representation
  88.  * and the code that checks for various cases, we construct a set of bitmasks.
  89.  */
  90. #define S_READ 0x00001 /* Read locks. */
  91. #define S_WRITE 0x00002 /* Write locks. */
  92. #define S_APPEND 0x00040 /* Append to the tree. */
  93. #define S_DELNO 0x00080 /* Don't return deleted items. */
  94. #define S_DUPFIRST 0x00100 /* Return first duplicate. */
  95. #define S_DUPLAST 0x00200 /* Return last duplicate. */
  96. #define S_EXACT 0x00400 /* Exact items only. */
  97. #define S_PARENT 0x00800 /* Lock page pair. */
  98. #define S_STACK 0x01000 /* Need a complete stack. */
  99. #define S_PAST_EOF 0x02000 /* If doing insert search (or keyfirst
  100.  * or keylast operations), or a split
  101.  * on behalf of an insert, it's okay to
  102.  * return an entry one past end-of-page.
  103.  */
  104. #define S_STK_ONLY 0x04000 /* Just return info in the stack */
  105. #define S_DELETE (S_WRITE | S_DUPFIRST | S_DELNO | S_EXACT | S_STACK)
  106. #define S_FIND (S_READ | S_DUPFIRST | S_DELNO)
  107. #define S_FIND_WR (S_WRITE | S_DUPFIRST | S_DELNO)
  108. #define S_INSERT (S_WRITE | S_DUPLAST | S_PAST_EOF | S_STACK)
  109. #define S_KEYFIRST (S_WRITE | S_DUPFIRST | S_PAST_EOF | S_STACK)
  110. #define S_KEYLAST (S_WRITE | S_DUPLAST | S_PAST_EOF | S_STACK)
  111. #define S_WRPAIR (S_WRITE | S_DUPLAST | S_PAST_EOF | S_PARENT)
  112. /*
  113.  * Various routines pass around page references.  A page reference is
  114.  * a pointer to the page, and the indx indicates an item on the page.
  115.  * Each page reference may include a lock.
  116.  */
  117. struct __epg {
  118. PAGE      *page; /* The page. */
  119. db_indx_t     indx; /* The index on the page. */
  120. db_indx_t     entries; /* The number of entries on page */
  121. DB_LOCK       lock; /* The page's lock. */
  122. db_lockmode_t lock_mode; /* The lock mode. */
  123. };
  124. /*
  125.  * We maintain a stack of the pages that we're locking in the tree.  Grow
  126.  * the stack as necessary.
  127.  *
  128.  * XXX
  129.  * Temporary fix for #3243 -- clear the page and lock from the stack entry.
  130.  * The correct fix is to never release a stack that doesn't hold items.
  131.  */
  132. #define BT_STK_CLR(c) do {
  133. (c)->csp = (c)->sp;
  134. (c)->csp->page = NULL;
  135. LOCK_INIT((c)->csp->lock);
  136. } while (0)
  137. #define BT_STK_ENTER(dbenv, c, pagep, page_indx, l, mode, ret) do {
  138. if ((ret =
  139.     (c)->csp == (c)->esp ? __bam_stkgrow(dbenv, c) : 0) == 0) {
  140. (c)->csp->page = pagep;
  141. (c)->csp->indx = page_indx;
  142. (c)->csp->entries = NUM_ENT(pagep);
  143. (c)->csp->lock = l;
  144. (c)->csp->lock_mode = mode;
  145. }
  146. } while (0)
  147. #define BT_STK_PUSH(dbenv, c, pagep, page_indx, lock, mode, ret) do {
  148. BT_STK_ENTER(dbenv, c, pagep, page_indx, lock, mode, ret);
  149. ++(c)->csp;
  150. } while (0)
  151. #define BT_STK_NUM(dbenv, c, pagep, page_indx, ret) do {
  152. if ((ret =
  153.     (c)->csp == (c)->esp ? __bam_stkgrow(dbenv, c) : 0) == 0) {
  154. (c)->csp->page = NULL;
  155. (c)->csp->indx = page_indx;
  156. (c)->csp->entries = NUM_ENT(pagep);
  157. LOCK_INIT((c)->csp->lock);
  158. (c)->csp->lock_mode = DB_LOCK_NG;
  159. }
  160. } while (0)
  161. #define BT_STK_NUMPUSH(dbenv, c, pagep, page_indx, ret) do {
  162. BT_STK_NUM(dbenv, cp, pagep, page_indx, ret);
  163. ++(c)->csp;
  164. } while (0)
  165. #define BT_STK_POP(c)
  166. ((c)->csp == (c)->sp ? NULL : --(c)->csp)
  167. /* Btree/Recno cursor. */
  168. struct __cursor {
  169. /* struct __dbc_internal */
  170. __DBC_INTERNAL
  171. /* btree private part */
  172. EPG *sp; /* Stack pointer. */
  173. EPG *csp; /* Current stack entry. */
  174. EPG *esp; /* End stack pointer. */
  175. EPG  stack[5];
  176. db_indx_t  ovflsize; /* Maximum key/data on-page size. */
  177. db_recno_t  recno; /* Current record number. */
  178. u_int32_t  order; /* Relative order among deleted curs. */
  179. /*
  180.  * Btree:
  181.  * We set a flag in the cursor structure if the underlying object has
  182.  * been deleted.  It's not strictly necessary, we could get the same
  183.  * information by looking at the page itself, but this method doesn't
  184.  * require us to retrieve the page on cursor delete.
  185.  *
  186.  * Recno:
  187.  * When renumbering recno databases during deletes, cursors referencing
  188.  * "deleted" records end up positioned between two records, and so must
  189.  * be specially adjusted on the next operation.
  190.  */
  191. #define C_DELETED 0x0001 /* Record was deleted. */
  192. /*
  193.  * There are three tree types that require maintaining record numbers.
  194.  * Recno AM trees, Btree AM trees for which the DB_RECNUM flag was set,
  195.  * and Btree off-page duplicate trees.
  196.  */
  197. #define C_RECNUM 0x0002 /* Tree requires record counts. */
  198. /*
  199.  * Recno trees have immutable record numbers by default, but optionally
  200.  * support mutable record numbers.  Off-page duplicate Recno trees have
  201.  * mutable record numbers.  All Btrees with record numbers (including
  202.  * off-page duplicate trees) are mutable by design, no flag is needed.
  203.  */
  204. #define C_RENUMBER 0x0004 /* Tree records are mutable. */
  205. u_int32_t  flags;
  206. };
  207. /*
  208.  * Threshhold value, as a function of bt_minkey, of the number of
  209.  * bytes a key/data pair can use before being placed on an overflow
  210.  * page.  Assume every item requires the maximum alignment for
  211.  * padding, out of sheer paranoia.
  212.  */
  213. #define B_MINKEY_TO_OVFLSIZE(dbp, minkey, pgsize)
  214. ((u_int16_t)(((pgsize) - P_OVERHEAD(dbp)) / ((minkey) * P_INDX) -
  215.     (BKEYDATA_PSIZE(0) + ALIGN(1, sizeof(int32_t)))))
  216. /*
  217.  * The maximum space that a single item can ever take up on one page.
  218.  * Used by __bam_split to determine whether a split is still necessary.
  219.  */
  220. #define B_MAX(a,b) (((a) > (b)) ? (a) : (b))
  221. #define B_MAXSIZEONPAGE(ovflsize)
  222. (B_MAX(BOVERFLOW_PSIZE, BKEYDATA_PSIZE(ovflsize)))
  223. /*
  224.  * The in-memory, per-tree btree/recno data structure.
  225.  */
  226. struct __btree { /* Btree access method. */
  227. /*
  228.  * !!!
  229.  * These fields are write-once (when the structure is created) and
  230.  * so are ignored as far as multi-threading is concerned.
  231.  */
  232. db_pgno_t bt_meta; /* Database meta-data page. */
  233. db_pgno_t bt_root; /* Database root page. */
  234. u_int32_t bt_maxkey; /* Maximum keys per page. */
  235. u_int32_t bt_minkey; /* Minimum keys per page. */
  236. /* Btree comparison function. */
  237. int (*bt_compare) __P((DB *, const DBT *, const DBT *));
  238. /* Btree prefix function. */
  239. size_t (*bt_prefix) __P((DB *, const DBT *, const DBT *));
  240. /* Recno access method. */
  241. int   re_pad; /* Fixed-length padding byte. */
  242. int   re_delim; /* Variable-length delimiting byte. */
  243. u_int32_t re_len; /* Length for fixed-length records. */
  244. char  *re_source; /* Source file name. */
  245. /*
  246.  * !!!
  247.  * The bt_lpgno field is NOT protected by any mutex, and for this
  248.  * reason must be advisory only, so, while it is read/written by
  249.  * multiple threads, DB is completely indifferent to the quality
  250.  * of its information.
  251.  */
  252. db_pgno_t bt_lpgno; /* Last insert location. */
  253. /*
  254.  * !!!
  255.  * The re_modified field is NOT protected by any mutex, and for this
  256.  * reason cannot be anything more complicated than a zero/non-zero
  257.  * value.  The actual writing of the backing source file cannot be
  258.  * threaded, so clearing the flag isn't a problem.
  259.  */
  260. int   re_modified; /* If the tree was modified. */
  261. /*
  262.  * !!!
  263.  * These fields are ignored as far as multi-threading is concerned.
  264.  * There are no transaction semantics associated with backing files,
  265.  * nor is there any thread protection.
  266.  */
  267. FILE *re_fp; /* Source file handle. */
  268. int  re_eof; /* Backing source file EOF reached. */
  269. db_recno_t  re_last; /* Last record number read. */
  270. };
  271. /*
  272.  * Modes for the __bam_curadj recovery records (btree_curadj).
  273.  * These appear in log records, so we wire the values and
  274.  * do not leave it up to the compiler.
  275.  */
  276. typedef enum {
  277. DB_CA_DI = 1,
  278. DB_CA_DUP = 2,
  279. DB_CA_RSPLIT = 3,
  280. DB_CA_SPLIT = 4
  281. } db_ca_mode;
  282. #include "dbinc_auto/btree_auto.h"
  283. #include "dbinc_auto/btree_ext.h"
  284. #include "dbinc/db_am.h"
  285. #endif /* !_DB_BTREE_H_ */