db_page.h
上传用户:romrleung
上传日期:2022-05-23
资源大小:18897k
文件大小:23k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /*-
  2.  * See the file LICENSE for redistribution information.
  3.  *
  4.  * Copyright (c) 1996-2002
  5.  * Sleepycat Software.  All rights reserved.
  6.  *
  7.  * $Id: db_page.h,v 11.52 2002/09/13 21:24:04 bostic Exp $
  8.  */
  9. #ifndef _DB_PAGE_H_
  10. #define _DB_PAGE_H_
  11. #if defined(__cplusplus)
  12. extern "C" {
  13. #endif
  14. /*
  15.  * DB page formats.
  16.  *
  17.  * !!!
  18.  * This implementation requires that values within the following structures
  19.  * NOT be padded -- note, ANSI C permits random padding within structures.
  20.  * If your compiler pads randomly you can just forget ever making DB run on
  21.  * your system.  In addition, no data type can require larger alignment than
  22.  * its own size, e.g., a 4-byte data element may not require 8-byte alignment.
  23.  *
  24.  * Note that key/data lengths are often stored in db_indx_t's -- this is
  25.  * not accidental, nor does it limit the key/data size.  If the key/data
  26.  * item fits on a page, it's guaranteed to be small enough to fit into a
  27.  * db_indx_t, and storing it in one saves space.
  28.  */
  29. #define PGNO_INVALID 0 /* Invalid page number in any database. */
  30. #define PGNO_BASE_MD 0 /* Base database: metadata page number. */
  31. /* Page types. */
  32. #define P_INVALID 0 /* Invalid page type. */
  33. #define __P_DUPLICATE 1 /* Duplicate. DEPRECATED in 3.1 */
  34. #define P_HASH 2 /* Hash. */
  35. #define P_IBTREE 3 /* Btree internal. */
  36. #define P_IRECNO 4 /* Recno internal. */
  37. #define P_LBTREE 5 /* Btree leaf. */
  38. #define P_LRECNO 6 /* Recno leaf. */
  39. #define P_OVERFLOW 7 /* Overflow. */
  40. #define P_HASHMETA 8 /* Hash metadata page. */
  41. #define P_BTREEMETA 9 /* Btree metadata page. */
  42. #define P_QAMMETA 10 /* Queue metadata page. */
  43. #define P_QAMDATA 11 /* Queue data page. */
  44. #define P_LDUP 12 /* Off-page duplicate leaf. */
  45. #define P_PAGETYPE_MAX 13
  46. /*
  47.  * When we create pages in mpool, we ask mpool to clear some number of bytes
  48.  * in the header.  This number must be at least as big as the regular page
  49.  * headers and cover enough of the btree and hash meta-data pages to obliterate
  50.  * the page type.
  51.  */
  52. #define DB_PAGE_DB_LEN 32
  53. #define DB_PAGE_QUEUE_LEN 0
  54. /************************************************************************
  55.  GENERIC METADATA PAGE HEADER
  56.  *
  57.  * !!!
  58.  * The magic and version numbers have to be in the same place in all versions
  59.  * of the metadata page as the application may not have upgraded the database.
  60.  ************************************************************************/
  61. typedef struct _dbmeta33 {
  62. DB_LSN   lsn; /* 00-07: LSN. */
  63. db_pgno_t pgno; /* 08-11: Current page number. */
  64. u_int32_t magic; /* 12-15: Magic number. */
  65. u_int32_t version; /* 16-19: Version. */
  66. u_int32_t pagesize; /* 20-23: Pagesize. */
  67. u_int8_t  encrypt_alg; /*    24: Encryption algorithm. */
  68. u_int8_t  type; /*    25: Page type. */
  69. #define DBMETA_CHKSUM 0x01
  70. u_int8_t  metaflags; /* 26: Meta-only flags */
  71. u_int8_t  unused1; /* 27: Unused. */
  72. u_int32_t free; /* 28-31: Free list page number. */
  73. db_pgno_t last_pgno; /* 32-35: Page number of last page in db. */
  74. u_int32_t unused3; /* 36-39: Unused. */
  75. u_int32_t key_count; /* 40-43: Cached key count. */
  76. u_int32_t record_count; /* 44-47: Cached record count. */
  77. u_int32_t flags; /* 48-51: Flags: unique to each AM. */
  78. /* 52-71: Unique file ID. */
  79. u_int8_t  uid[DB_FILE_ID_LEN];
  80. } DBMETA33, DBMETA;
  81. /************************************************************************
  82.  BTREE METADATA PAGE LAYOUT
  83.  ************************************************************************/
  84. typedef struct _btmeta33 {
  85. #define BTM_DUP 0x001 /*   Duplicates. */
  86. #define BTM_RECNO 0x002 /*   Recno tree. */
  87. #define BTM_RECNUM 0x004 /*   Btree: maintain record count. */
  88. #define BTM_FIXEDLEN 0x008 /*   Recno: fixed length records. */
  89. #define BTM_RENUMBER 0x010 /*   Recno: renumber on insert/delete. */
  90. #define BTM_SUBDB 0x020 /*   Subdatabases. */
  91. #define BTM_DUPSORT 0x040 /*   Duplicates are sorted. */
  92. #define BTM_MASK 0x07f
  93. DBMETA dbmeta; /* 00-71: Generic meta-data header. */
  94. u_int32_t maxkey; /* 72-75: Btree: Maxkey. */
  95. u_int32_t minkey; /* 76-79: Btree: Minkey. */
  96. u_int32_t re_len; /* 80-83: Recno: fixed-length record length. */
  97. u_int32_t re_pad; /* 84-87: Recno: fixed-length record pad. */
  98. u_int32_t root; /* 88-91: Root page. */
  99. u_int32_t unused[92]; /* 92-459: Unused space */
  100. u_int32_t crypto_magic; /* 460-463: Crypto magic number */
  101. u_int32_t trash[3]; /* 464-475: Trash space - Do not use */
  102. u_int8_t iv[DB_IV_BYTES]; /* 476-495: Crypto IV */
  103. u_int8_t chksum[DB_MAC_KEY]; /* 496-511: Page chksum */
  104. /*
  105.  * Minimum page size is 512.
  106.  */
  107. } BTMETA33, BTMETA;
  108. /************************************************************************
  109.  HASH METADATA PAGE LAYOUT
  110.  ************************************************************************/
  111. typedef struct _hashmeta33 {
  112. #define DB_HASH_DUP 0x01 /*   Duplicates. */
  113. #define DB_HASH_SUBDB 0x02 /*   Subdatabases. */
  114. #define DB_HASH_DUPSORT 0x04 /*   Duplicates are sorted. */
  115. DBMETA dbmeta; /* 00-71: Generic meta-data page header. */
  116. u_int32_t max_bucket; /* 72-75: ID of Maximum bucket in use */
  117. u_int32_t high_mask; /* 76-79: Modulo mask into table */
  118. u_int32_t low_mask; /* 80-83: Modulo mask into table lower half */
  119. u_int32_t ffactor; /* 84-87: Fill factor */
  120. u_int32_t nelem; /* 88-91: Number of keys in hash table */
  121. u_int32_t h_charkey; /* 92-95: Value of hash(CHARKEY) */
  122. #define NCACHED 32 /* number of spare points */
  123. /* 96-223: Spare pages for overflow */
  124. u_int32_t spares[NCACHED];
  125. u_int32_t unused[59]; /* 224-459: Unused space */
  126. u_int32_t crypto_magic; /* 460-463: Crypto magic number */
  127. u_int32_t trash[3]; /* 464-475: Trash space - Do not use */
  128. u_int8_t iv[DB_IV_BYTES]; /* 476-495: Crypto IV */
  129. u_int8_t chksum[DB_MAC_KEY]; /* 496-511: Page chksum */
  130. /*
  131.  * Minimum page size is 512.
  132.  */
  133. } HMETA33, HMETA;
  134. /************************************************************************
  135.  QUEUE METADATA PAGE LAYOUT
  136.  ************************************************************************/
  137. /*
  138.  * QAM Meta data page structure
  139.  *
  140.  */
  141. typedef struct _qmeta33 {
  142. DBMETA    dbmeta; /* 00-71: Generic meta-data header. */
  143. u_int32_t first_recno; /* 72-75: First not deleted record. */
  144. u_int32_t cur_recno; /* 76-79: Next recno to be allocated. */
  145. u_int32_t re_len; /* 80-83: Fixed-length record length. */
  146. u_int32_t re_pad; /* 84-87: Fixed-length record pad. */
  147. u_int32_t rec_page; /* 88-91: Records Per Page. */
  148. u_int32_t page_ext; /* 92-95: Pages per extent */
  149. u_int32_t unused[91]; /* 96-459: Unused space */
  150. u_int32_t crypto_magic; /* 460-463: Crypto magic number */
  151. u_int32_t trash[3]; /* 464-475: Trash space - Do not use */
  152. u_int8_t iv[DB_IV_BYTES]; /* 476-495: Crypto IV */
  153. u_int8_t chksum[DB_MAC_KEY]; /* 496-511: Page chksum */
  154. /*
  155.  * Minimum page size is 512.
  156.  */
  157. } QMETA33, QMETA;
  158. /*
  159.  * DBMETASIZE is a constant used by __db_file_setup and DB->verify
  160.  * as a buffer which is guaranteed to be larger than any possible
  161.  * metadata page size and smaller than any disk sector.
  162.  */
  163. #define DBMETASIZE 512
  164. /************************************************************************
  165.  BTREE/HASH MAIN PAGE LAYOUT
  166.  ************************************************************************/
  167. /*
  168.  * +-----------------------------------+
  169.  * |    lsn    |   pgno    | prev pgno |
  170.  * +-----------------------------------+
  171.  * | next pgno |  entries  | hf offset |
  172.  * +-----------------------------------+
  173.  * |   level   |   type    |   chksum  |
  174.  * +-----------------------------------+
  175.  * |    iv     |   index   | free -->  |
  176.  * +-----------+-----------------------+
  177.  * |  F R E E A R E A            |
  178.  * +-----------------------------------+
  179.  * |              <-- free |   item    |
  180.  * +-----------------------------------+
  181.  * |   item    |   item    |   item    |
  182.  * +-----------------------------------+
  183.  *
  184.  * sizeof(PAGE) == 26 bytes + possibly 20 bytes of checksum and possibly
  185.  * 16 bytes of IV (+ 2 bytes for alignment), and the following indices
  186.  * are guaranteed to be two-byte aligned.  If we aren't doing crypto or
  187.  * checksumming the bytes are reclaimed for data storage.
  188.  *
  189.  * For hash and btree leaf pages, index items are paired, e.g., inp[0] is the
  190.  * key for inp[1]'s data.  All other types of pages only contain single items.
  191.  */
  192. typedef struct __pg_chksum {
  193. u_int8_t unused[2]; /* 26-27: For alignment */
  194. u_int8_t chksum[4]; /* 28-31: Checksum */
  195. } PG_CHKSUM;
  196. typedef struct __pg_crypto {
  197. u_int8_t unused[2]; /* 26-27: For alignment */
  198. u_int8_t chksum[DB_MAC_KEY]; /* 28-47: Checksum */
  199. u_int8_t iv[DB_IV_BYTES]; /* 48-63: IV */
  200. /* !!!
  201.  * Must be 16-byte aligned for crypto
  202.  */
  203. } PG_CRYPTO;
  204. typedef struct _db_page {
  205. DB_LSN   lsn; /* 00-07: Log sequence number. */
  206. db_pgno_t pgno; /* 08-11: Current page number. */
  207. db_pgno_t prev_pgno; /* 12-15: Previous page number. */
  208. db_pgno_t next_pgno; /* 16-19: Next page number. */
  209. db_indx_t entries; /* 20-21: Number of items on the page. */
  210. db_indx_t hf_offset; /* 22-23: High free byte page offset. */
  211. /*
  212.  * The btree levels are numbered from the leaf to the root, starting
  213.  * with 1, so the leaf is level 1, its parent is level 2, and so on.
  214.  * We maintain this level on all btree pages, but the only place that
  215.  * we actually need it is on the root page.  It would not be difficult
  216.  * to hide the byte on the root page once it becomes an internal page,
  217.  * so we could get this byte back if we needed it for something else.
  218.  */
  219. #define LEAFLEVEL   1
  220. #define MAXBTREELEVEL 255
  221. u_int8_t  level; /*    24: Btree tree level. */
  222. u_int8_t  type; /*    25: Page type. */
  223. } PAGE;
  224. #define SIZEOF_PAGE 26
  225. /*
  226.  * !!!
  227.  * DB_AM_ENCRYPT always implies DB_AM_CHKSUM so that must come first.
  228.  */
  229. #define P_INP(dbp, pg)
  230. ((db_indx_t *)((u_int8_t *)(pg) + SIZEOF_PAGE +
  231. (F_ISSET((dbp), DB_AM_ENCRYPT) ? sizeof(PG_CRYPTO) :
  232. (F_ISSET((dbp), DB_AM_CHKSUM) ? sizeof(PG_CHKSUM) : 0))))
  233. #define P_IV(dbp, pg)
  234. (F_ISSET((dbp), DB_AM_ENCRYPT) ? ((u_int8_t *)(pg) +
  235. SIZEOF_PAGE + SSZA(PG_CRYPTO, iv))
  236. : NULL)
  237. #define P_CHKSUM(dbp, pg)
  238. (F_ISSET((dbp), DB_AM_ENCRYPT) ? ((u_int8_t *)(pg) +
  239. SIZEOF_PAGE + SSZA(PG_CRYPTO, chksum)) :
  240. (F_ISSET((dbp), DB_AM_CHKSUM) ? ((u_int8_t *)(pg) +
  241. SIZEOF_PAGE + SSZA(PG_CHKSUM, chksum))
  242. : NULL))
  243. /* PAGE element macros. */
  244. #define LSN(p) (((PAGE *)p)->lsn)
  245. #define PGNO(p) (((PAGE *)p)->pgno)
  246. #define PREV_PGNO(p) (((PAGE *)p)->prev_pgno)
  247. #define NEXT_PGNO(p) (((PAGE *)p)->next_pgno)
  248. #define NUM_ENT(p) (((PAGE *)p)->entries)
  249. #define HOFFSET(p) (((PAGE *)p)->hf_offset)
  250. #define LEVEL(p) (((PAGE *)p)->level)
  251. #define TYPE(p) (((PAGE *)p)->type)
  252. /************************************************************************
  253.  QUEUE MAIN PAGE LAYOUT
  254.  ************************************************************************/
  255. /*
  256.  * Sizes of page below.  Used to reclaim space if not doing
  257.  * crypto or checksumming.  If you change the QPAGE below you
  258.  * MUST adjust this too.
  259.  */
  260. #define QPAGE_NORMAL 28
  261. #define QPAGE_CHKSUM 48
  262. #define QPAGE_SEC 64
  263. typedef struct _qpage {
  264. DB_LSN   lsn; /* 00-07: Log sequence number. */
  265. db_pgno_t pgno; /* 08-11: Current page number. */
  266. u_int32_t unused0[3]; /* 12-23: Unused. */
  267. u_int8_t  unused1[1]; /*    24: Unused. */
  268. u_int8_t  type; /*    25: Page type. */
  269. u_int8_t  unused2[2]; /* 26-27: Unused. */
  270. u_int8_t  chksum[DB_MAC_KEY]; /* 28-47: Checksum */
  271. u_int8_t  iv[DB_IV_BYTES]; /* 48-63: IV */
  272. } QPAGE;
  273. #define QPAGE_SZ(dbp)
  274. (F_ISSET((dbp), DB_AM_ENCRYPT) ? QPAGE_SEC :
  275. F_ISSET((dbp), DB_AM_CHKSUM) ? QPAGE_CHKSUM : QPAGE_NORMAL)
  276. /*
  277.  * !!!
  278.  * The next_pgno and prev_pgno fields are not maintained for btree and recno
  279.  * internal pages.  Doing so only provides a minor performance improvement,
  280.  * it's hard to do when deleting internal pages, and it increases the chance
  281.  * of deadlock during deletes and splits because we have to re-link pages at
  282.  * more than the leaf level.
  283.  *
  284.  * !!!
  285.  * The btree/recno access method needs db_recno_t bytes of space on the root
  286.  * page to specify how many records are stored in the tree.  (The alternative
  287.  * is to store the number of records in the meta-data page, which will create
  288.  * a second hot spot in trees being actively modified, or recalculate it from
  289.  * the BINTERNAL fields on each access.)  Overload the PREV_PGNO field.
  290.  */
  291. #define RE_NREC(p)
  292. ((TYPE(p) == P_IBTREE || TYPE(p) == P_IRECNO) ? PREV_PGNO(p) :
  293. (db_pgno_t)(TYPE(p) == P_LBTREE ? NUM_ENT(p) / 2 : NUM_ENT(p)))
  294. #define RE_NREC_ADJ(p, adj)
  295. PREV_PGNO(p) += adj;
  296. #define RE_NREC_SET(p, num)
  297. PREV_PGNO(p) = num;
  298. /*
  299.  * Initialize a page.
  300.  *
  301.  * !!!
  302.  * Don't modify the page's LSN, code depends on it being unchanged after a
  303.  * P_INIT call.
  304.  */
  305. #define P_INIT(pg, pg_size, n, pg_prev, pg_next, btl, pg_type) do {
  306. PGNO(pg) = n;
  307. PREV_PGNO(pg) = pg_prev;
  308. NEXT_PGNO(pg) = pg_next;
  309. NUM_ENT(pg) = 0;
  310. HOFFSET(pg) = pg_size;
  311. LEVEL(pg) = btl;
  312. TYPE(pg) = pg_type;
  313. } while (0)
  314. /* Page header length (offset to first index). */
  315. #define P_OVERHEAD(dbp) P_TO_UINT16(P_INP(dbp, 0))
  316. /* First free byte. */
  317. #define LOFFSET(dbp, pg)
  318.     (P_OVERHEAD(dbp) + NUM_ENT(pg) * sizeof(db_indx_t))
  319. /* Free space on a regular page. */
  320. #define P_FREESPACE(dbp, pg) (HOFFSET(pg) - LOFFSET(dbp, pg))
  321. /* Get a pointer to the bytes at a specific index. */
  322. #define P_ENTRY(dbp, pg, indx) ((u_int8_t *)pg + P_INP(dbp, pg)[indx])
  323. /************************************************************************
  324.  OVERFLOW PAGE LAYOUT
  325.  ************************************************************************/
  326. /*
  327.  * Overflow items are referenced by HOFFPAGE and BOVERFLOW structures, which
  328.  * store a page number (the first page of the overflow item) and a length
  329.  * (the total length of the overflow item).  The overflow item consists of
  330.  * some number of overflow pages, linked by the next_pgno field of the page.
  331.  * A next_pgno field of PGNO_INVALID flags the end of the overflow item.
  332.  *
  333.  * Overflow page overloads:
  334.  * The amount of overflow data stored on each page is stored in the
  335.  * hf_offset field.
  336.  *
  337.  * The implementation reference counts overflow items as it's possible
  338.  * for them to be promoted onto btree internal pages.  The reference
  339.  * count is stored in the entries field.
  340.  */
  341. #define OV_LEN(p) (((PAGE *)p)->hf_offset)
  342. #define OV_REF(p) (((PAGE *)p)->entries)
  343. /* Maximum number of bytes that you can put on an overflow page. */
  344. #define P_MAXSPACE(dbp, psize) ((psize) - P_OVERHEAD(dbp))
  345. /* Free space on an overflow page. */
  346. #define P_OVFLSPACE(dbp, psize, pg) (P_MAXSPACE(dbp, psize) - HOFFSET(pg))
  347. /************************************************************************
  348.  HASH PAGE LAYOUT
  349.  ************************************************************************/
  350. /* Each index references a group of bytes on the page. */
  351. #define H_KEYDATA 1 /* Key/data item. */
  352. #define H_DUPLICATE 2 /* Duplicate key/data item. */
  353. #define H_OFFPAGE 3 /* Overflow key/data item. */
  354. #define H_OFFDUP 4 /* Overflow page of duplicates. */
  355. /*
  356.  * !!!
  357.  * Items on hash pages are (potentially) unaligned, so we can never cast the
  358.  * (page + offset) pointer to an HKEYDATA, HOFFPAGE or HOFFDUP structure, as
  359.  * we do with B+tree on-page structures.  Because we frequently want the type
  360.  * field, it requires no alignment, and it's in the same location in all three
  361.  * structures, there's a pair of macros.
  362.  */
  363. #define HPAGE_PTYPE(p) (*(u_int8_t *)p)
  364. #define HPAGE_TYPE(dbp, pg, indx) (*P_ENTRY(dbp, pg, indx))
  365. /*
  366.  * The first and second types are H_KEYDATA and H_DUPLICATE, represented
  367.  * by the HKEYDATA structure:
  368.  *
  369.  * +-----------------------------------+
  370.  * |    type   | key/data ...          |
  371.  * +-----------------------------------+
  372.  *
  373.  * For duplicates, the data field encodes duplicate elements in the data
  374.  * field:
  375.  *
  376.  * +---------------------------------------------------------------+
  377.  * |    type   | len1 | element1 | len1 | len2 | element2 | len2   |
  378.  * +---------------------------------------------------------------+
  379.  *
  380.  * Thus, by keeping track of the offset in the element, we can do both
  381.  * backward and forward traversal.
  382.  */
  383. typedef struct _hkeydata {
  384. u_int8_t  type; /*    00: Page type. */
  385. u_int8_t  data[1]; /* Variable length key/data item. */
  386. } HKEYDATA;
  387. #define HKEYDATA_DATA(p) (((u_int8_t *)p) + SSZA(HKEYDATA, data))
  388. /*
  389.  * The length of any HKEYDATA item. Note that indx is an element index,
  390.  * not a PAIR index.
  391.  */
  392. #define LEN_HITEM(dbp, pg, pgsize, indx)
  393. (((indx) == 0 ? pgsize :
  394. (P_INP(dbp, pg)[indx - 1])) - (P_INP(dbp, pg)[indx]))
  395. #define LEN_HKEYDATA(dbp, pg, psize, indx)
  396. (db_indx_t)(LEN_HITEM(dbp, pg, psize, indx) - HKEYDATA_SIZE(0))
  397. /*
  398.  * Page space required to add a new HKEYDATA item to the page, with and
  399.  * without the index value.
  400.  */
  401. #define HKEYDATA_SIZE(len)
  402. ((len) + SSZA(HKEYDATA, data))
  403. #define HKEYDATA_PSIZE(len)
  404. (HKEYDATA_SIZE(len) + sizeof(db_indx_t))
  405. /* Put a HKEYDATA item at the location referenced by a page entry. */
  406. #define PUT_HKEYDATA(pe, kd, len, type) {
  407. ((HKEYDATA *)pe)->type = type;
  408. memcpy((u_int8_t *)pe + sizeof(u_int8_t), kd, len);
  409. }
  410. /*
  411.  * Macros the describe the page layout in terms of key-data pairs.
  412.  */
  413. #define H_NUMPAIRS(pg) (NUM_ENT(pg) / 2)
  414. #define H_KEYINDEX(indx) (indx)
  415. #define H_DATAINDEX(indx) ((indx) + 1)
  416. #define H_PAIRKEY(dbp, pg, indx) P_ENTRY(dbp, pg, H_KEYINDEX(indx))
  417. #define H_PAIRDATA(dbp, pg, indx) P_ENTRY(dbp, pg, H_DATAINDEX(indx))
  418. #define H_PAIRSIZE(dbp, pg, psize, indx)
  419. (LEN_HITEM(dbp, pg, psize, H_KEYINDEX(indx)) +
  420. LEN_HITEM(dbp, pg, psize, H_DATAINDEX(indx)))
  421. #define LEN_HDATA(dbp, p, psize, indx)
  422.     LEN_HKEYDATA(dbp, p, psize, H_DATAINDEX(indx))
  423. #define LEN_HKEY(dbp, p, psize, indx)
  424.     LEN_HKEYDATA(dbp, p, psize, H_KEYINDEX(indx))
  425. /*
  426.  * The third type is the H_OFFPAGE, represented by the HOFFPAGE structure:
  427.  */
  428. typedef struct _hoffpage {
  429. u_int8_t  type; /*    00: Page type and delete flag. */
  430. u_int8_t  unused[3]; /* 01-03: Padding, unused. */
  431. db_pgno_t pgno; /* 04-07: Offpage page number. */
  432. u_int32_t tlen; /* 08-11: Total length of item. */
  433. } HOFFPAGE;
  434. #define HOFFPAGE_PGNO(p) (((u_int8_t *)p) + SSZ(HOFFPAGE, pgno))
  435. #define HOFFPAGE_TLEN(p) (((u_int8_t *)p) + SSZ(HOFFPAGE, tlen))
  436. /*
  437.  * Page space required to add a new HOFFPAGE item to the page, with and
  438.  * without the index value.
  439.  */
  440. #define HOFFPAGE_SIZE (sizeof(HOFFPAGE))
  441. #define HOFFPAGE_PSIZE (HOFFPAGE_SIZE + sizeof(db_indx_t))
  442. /*
  443.  * The fourth type is H_OFFDUP represented by the HOFFDUP structure:
  444.  */
  445. typedef struct _hoffdup {
  446. u_int8_t  type; /*    00: Page type and delete flag. */
  447. u_int8_t  unused[3]; /* 01-03: Padding, unused. */
  448. db_pgno_t pgno; /* 04-07: Offpage page number. */
  449. } HOFFDUP;
  450. #define HOFFDUP_PGNO(p) (((u_int8_t *)p) + SSZ(HOFFDUP, pgno))
  451. /*
  452.  * Page space required to add a new HOFFDUP item to the page, with and
  453.  * without the index value.
  454.  */
  455. #define HOFFDUP_SIZE (sizeof(HOFFDUP))
  456. /************************************************************************
  457.  BTREE PAGE LAYOUT
  458.  ************************************************************************/
  459. /* Each index references a group of bytes on the page. */
  460. #define B_KEYDATA 1 /* Key/data item. */
  461. #define B_DUPLICATE 2 /* Duplicate key/data item. */
  462. #define B_OVERFLOW 3 /* Overflow key/data item. */
  463. /*
  464.  * We have to store a deleted entry flag in the page.   The reason is complex,
  465.  * but the simple version is that we can't delete on-page items referenced by
  466.  * a cursor -- the return order of subsequent insertions might be wrong.  The
  467.  * delete flag is an overload of the top bit of the type byte.
  468.  */
  469. #define B_DELETE (0x80)
  470. #define B_DCLR(t) (t) &= ~B_DELETE
  471. #define B_DSET(t) (t) |= B_DELETE
  472. #define B_DISSET(t) ((t) & B_DELETE)
  473. #define B_TYPE(t) ((t) & ~B_DELETE)
  474. #define B_TSET(t, type, deleted) {
  475. (t) = (type);
  476. if (deleted)
  477. B_DSET(t);
  478. }
  479. /*
  480.  * The first type is B_KEYDATA, represented by the BKEYDATA structure:
  481.  */
  482. typedef struct _bkeydata {
  483. db_indx_t len; /* 00-01: Key/data item length. */
  484. u_int8_t  type; /*    02: Page type AND DELETE FLAG. */
  485. u_int8_t  data[1]; /* Variable length key/data item. */
  486. } BKEYDATA;
  487. /* Get a BKEYDATA item for a specific index. */
  488. #define GET_BKEYDATA(dbp, pg, indx)
  489. ((BKEYDATA *)P_ENTRY(dbp, pg, indx))
  490. /*
  491.  * Page space required to add a new BKEYDATA item to the page, with and
  492.  * without the index value.
  493.  */
  494. #define BKEYDATA_SIZE(len)
  495. ALIGN((len) + SSZA(BKEYDATA, data), sizeof(u_int32_t))
  496. #define BKEYDATA_PSIZE(len)
  497. (BKEYDATA_SIZE(len) + sizeof(db_indx_t))
  498. /*
  499.  * The second and third types are B_DUPLICATE and B_OVERFLOW, represented
  500.  * by the BOVERFLOW structure.
  501.  */
  502. typedef struct _boverflow {
  503. db_indx_t unused1; /* 00-01: Padding, unused. */
  504. u_int8_t  type; /*    02: Page type AND DELETE FLAG. */
  505. u_int8_t  unused2; /*    03: Padding, unused. */
  506. db_pgno_t pgno; /* 04-07: Next page number. */
  507. u_int32_t tlen; /* 08-11: Total length of item. */
  508. } BOVERFLOW;
  509. /* Get a BOVERFLOW item for a specific index. */
  510. #define GET_BOVERFLOW(dbp, pg, indx)
  511. ((BOVERFLOW *)P_ENTRY(dbp, pg, indx))
  512. /*
  513.  * Page space required to add a new BOVERFLOW item to the page, with and
  514.  * without the index value.  The (u_int16_t) cast avoids warnings: ALIGN
  515.  * casts to db_align_t, the cast converts it to a small integral type so
  516.  * we don't get complaints when we assign the final result to an integral
  517.  * type smaller than db_align_t.
  518.  */
  519. #define BOVERFLOW_SIZE
  520. ((u_int16_t)ALIGN(sizeof(BOVERFLOW), sizeof(u_int32_t)))
  521. #define BOVERFLOW_PSIZE
  522. (BOVERFLOW_SIZE + sizeof(db_indx_t))
  523. /*
  524.  * Btree leaf and hash page layouts group indices in sets of two, one for the
  525.  * key and one for the data.  Everything else does it in sets of one to save
  526.  * space.  Use the following macros so that it's real obvious what's going on.
  527.  */
  528. #define O_INDX 1
  529. #define P_INDX 2
  530. /************************************************************************
  531.  BTREE INTERNAL PAGE LAYOUT
  532.  ************************************************************************/
  533. /*
  534.  * Btree internal entry.
  535.  */
  536. typedef struct _binternal {
  537. db_indx_t  len; /* 00-01: Key/data item length. */
  538. u_int8_t   type; /*    02: Page type AND DELETE FLAG. */
  539. u_int8_t   unused; /*    03: Padding, unused. */
  540. db_pgno_t  pgno; /* 04-07: Page number of referenced page. */
  541. db_recno_t nrecs; /* 08-11: Subtree record count. */
  542. u_int8_t   data[1]; /* Variable length key item. */
  543. } BINTERNAL;
  544. /* Get a BINTERNAL item for a specific index. */
  545. #define GET_BINTERNAL(dbp, pg, indx)
  546. ((BINTERNAL *)P_ENTRY(dbp, pg, indx))
  547. /*
  548.  * Page space required to add a new BINTERNAL item to the page, with and
  549.  * without the index value.
  550.  */
  551. #define BINTERNAL_SIZE(len)
  552. ALIGN((len) + SSZA(BINTERNAL, data), sizeof(u_int32_t))
  553. #define BINTERNAL_PSIZE(len)
  554. (BINTERNAL_SIZE(len) + sizeof(db_indx_t))
  555. /************************************************************************
  556.  RECNO INTERNAL PAGE LAYOUT
  557.  ************************************************************************/
  558. /*
  559.  * The recno internal entry.
  560.  */
  561. typedef struct _rinternal {
  562. db_pgno_t  pgno; /* 00-03: Page number of referenced page. */
  563. db_recno_t nrecs; /* 04-07: Subtree record count. */
  564. } RINTERNAL;
  565. /* Get a RINTERNAL item for a specific index. */
  566. #define GET_RINTERNAL(dbp, pg, indx)
  567. ((RINTERNAL *)P_ENTRY(dbp, pg, indx))
  568. /*
  569.  * Page space required to add a new RINTERNAL item to the page, with and
  570.  * without the index value.
  571.  */
  572. #define RINTERNAL_SIZE
  573. ALIGN(sizeof(RINTERNAL), sizeof(u_int32_t))
  574. #define RINTERNAL_PSIZE
  575. (RINTERNAL_SIZE + sizeof(db_indx_t))
  576. #if defined(__cplusplus)
  577. }
  578. #endif
  579. #endif /* !_DB_PAGE_H_ */