bt_recno.c
上传用户:tsgydb
上传日期:2007-04-14
资源大小:10674k
文件大小:35k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /*-
  2.  * See the file LICENSE for redistribution information.
  3.  *
  4.  * Copyright (c) 1997, 1998, 1999, 2000
  5.  * Sleepycat Software.  All rights reserved.
  6.  */
  7. #include "db_config.h"
  8. #ifndef lint
  9. static const char revid[] = "$Id: bt_recno.c,v 11.65 2001/01/18 14:33:22 bostic Exp $";
  10. #endif /* not lint */
  11. #ifndef NO_SYSTEM_INCLUDES
  12. #include <sys/types.h>
  13. #include <limits.h>
  14. #include <string.h>
  15. #endif
  16. #include "db_int.h"
  17. #include "db_page.h"
  18. #include "btree.h"
  19. #include "db_ext.h"
  20. #include "db_shash.h"
  21. #include "lock.h"
  22. #include "lock_ext.h"
  23. #include "qam.h"
  24. #include "txn.h"
  25. static int  __ram_add __P((DBC *, db_recno_t *, DBT *, u_int32_t, u_int32_t));
  26. static int  __ram_delete __P((DB *, DB_TXN *, DBT *, u_int32_t));
  27. static int  __ram_put __P((DB *, DB_TXN *, DBT *, DBT *, u_int32_t));
  28. static int  __ram_source __P((DB *));
  29. static int  __ram_sread __P((DBC *, db_recno_t));
  30. static int  __ram_update __P((DBC *, db_recno_t, int));
  31. /*
  32.  * In recno, there are two meanings to the on-page "deleted" flag.  If we're
  33.  * re-numbering records, it means the record was implicitly created.  We skip
  34.  * over implicitly created records if doing a cursor "next" or "prev", and
  35.  * return DB_KEYEMPTY if they're explicitly requested..  If not re-numbering
  36.  * records, it means that the record was implicitly created, or was deleted.
  37.  * We skip over implicitly created or deleted records if doing a cursor "next"
  38.  * or "prev", and return DB_KEYEMPTY if they're explicitly requested.
  39.  *
  40.  * If we're re-numbering records, then we have to detect in the cursor that
  41.  * a record was deleted, and adjust the cursor as necessary on the next get.
  42.  * If we're not re-numbering records, then we can detect that a record has
  43.  * been deleted by looking at the actual on-page record, so we completely
  44.  * ignore the cursor's delete flag.  This is different from the B+tree code.
  45.  * It also maintains whether the cursor references a deleted record in the
  46.  * cursor, and it doesn't always check the on-page value.
  47.  */
  48. #define CD_SET(cp) {
  49. if (F_ISSET(cp, C_RENUMBER))
  50. F_SET(cp, C_DELETED);
  51. }
  52. #define CD_CLR(cp) {
  53. if (F_ISSET(cp, C_RENUMBER)) {
  54. F_CLR(cp, C_DELETED);
  55. cp->order = INVALID_ORDER;
  56. }
  57. }
  58. #define CD_ISSET(cp)
  59. (F_ISSET(cp, C_RENUMBER) && F_ISSET(cp, C_DELETED))
  60. /*
  61.  * Macros for comparing the ordering of two cursors.
  62.  * cp1 comes before cp2 iff one of the following holds:
  63.  * cp1's recno is less than cp2's recno
  64.  * recnos are equal, both deleted, and cp1's order is less than cp2's
  65.  * recnos are equal, cp1 deleted, and cp2 not deleted
  66.  */
  67. #define C_LESSTHAN(cp1, cp2)
  68.     (((cp1)->recno < (cp2)->recno) ||
  69.     (((cp1)->recno == (cp2)->recno) &&
  70.     ((CD_ISSET((cp1)) && CD_ISSET((cp2)) && (cp1)->order < (cp2)->order) || 
  71.     (CD_ISSET((cp1)) && !CD_ISSET((cp2))))))
  72. /*
  73.  * cp1 is equal to cp2 iff their recnos and delete flags are identical,
  74.  * and if the delete flag is set their orders are also identical.
  75.  */
  76. #define C_EQUAL(cp1, cp2)
  77.     ((cp1)->recno == (cp2)->recno && CD_ISSET((cp1)) == CD_ISSET((cp2)) && 
  78.     (!CD_ISSET((cp1)) || (cp1)->order == (cp2)->order))
  79. /*
  80.  * Do we need to log the current cursor adjustment?
  81.  */
  82. #define CURADJ_LOG(dbc)
  83. (DB_LOGGING((dbc)) && (dbc)->txn != NULL && (dbc)->txn->parent != NULL)
  84. /*
  85.  * __ram_open --
  86.  * Recno open function.
  87.  *
  88.  * PUBLIC: int __ram_open __P((DB *, const char *, db_pgno_t, u_int32_t));
  89.  */
  90. int
  91. __ram_open(dbp, name, base_pgno, flags)
  92. DB *dbp;
  93. const char *name;
  94. db_pgno_t base_pgno;
  95. u_int32_t flags;
  96. {
  97. BTREE *t;
  98. DBC *dbc;
  99. int ret, t_ret;
  100. t = dbp->bt_internal;
  101. /* Initialize the remaining fields/methods of the DB. */
  102. dbp->del = __ram_delete;
  103. dbp->put = __ram_put;
  104. dbp->stat = __bam_stat;
  105. /* Start up the tree. */
  106. if ((ret = __bam_read_root(dbp, name, base_pgno, flags)) != 0)
  107. return (ret);
  108. /*
  109.  * If the user specified a source tree, open it and map it in.
  110.  *
  111.  * !!!
  112.  * We don't complain if the user specified transactions or threads.
  113.  * It's possible to make it work, but you'd better know what you're
  114.  * doing!
  115.  */
  116. if (t->re_source != NULL && (ret = __ram_source(dbp)) != 0)
  117. return (ret);
  118. /* If we're snapshotting an underlying source file, do it now. */
  119. if (F_ISSET(dbp, DB_RE_SNAPSHOT)) {
  120. /* Allocate a cursor. */
  121. if ((ret = dbp->cursor(dbp, NULL, &dbc, 0)) != 0)
  122. return (ret);
  123. /* Do the snapshot. */
  124. if ((ret = __ram_update(dbc,
  125.     DB_MAX_RECORDS, 0)) != 0 && ret == DB_NOTFOUND)
  126. ret = 0;
  127. /* Discard the cursor. */
  128. if ((t_ret = dbc->c_close(dbc)) != 0 && ret == 0)
  129. ret = t_ret;
  130. }
  131. return (0);
  132. }
  133. /*
  134.  * __ram_delete --
  135.  * Recno db->del function.
  136.  */
  137. static int
  138. __ram_delete(dbp, txn, key, flags)
  139. DB *dbp;
  140. DB_TXN *txn;
  141. DBT *key;
  142. u_int32_t flags;
  143. {
  144. BTREE_CURSOR *cp;
  145. DBC *dbc;
  146. db_recno_t recno;
  147. int ret, t_ret;
  148. PANIC_CHECK(dbp->dbenv);
  149. /* Check for invalid flags. */
  150. if ((ret = __db_delchk(dbp,
  151.     key, flags, F_ISSET(dbp, DB_AM_RDONLY))) != 0)
  152. return (ret);
  153. /* Acquire a cursor. */
  154. if ((ret = dbp->cursor(dbp, txn, &dbc, DB_WRITELOCK)) != 0)
  155. return (ret);
  156. DEBUG_LWRITE(dbc, txn, "ram_delete", key, NULL, flags);
  157. /* Check the user's record number and fill in as necessary. */
  158. if ((ret = __ram_getno(dbc, key, &recno, 0)) != 0)
  159. goto err;
  160. /* Do the delete. */
  161. cp = (BTREE_CURSOR *)dbc->internal;
  162. cp->recno = recno;
  163. ret = __ram_c_del(dbc);
  164. /* Release the cursor. */
  165. err: if ((t_ret = dbc->c_close(dbc)) != 0 && ret == 0)
  166. ret = t_ret;
  167. return (ret);
  168. }
  169. /*
  170.  * __ram_put --
  171.  * Recno db->put function.
  172.  */
  173. static int
  174. __ram_put(dbp, txn, key, data, flags)
  175. DB *dbp;
  176. DB_TXN *txn;
  177. DBT *key, *data;
  178. u_int32_t flags;
  179. {
  180. DBC *dbc;
  181. db_recno_t recno;
  182. int ret, t_ret;
  183. PANIC_CHECK(dbp->dbenv);
  184. /* Check for invalid flags. */
  185. if ((ret = __db_putchk(dbp,
  186.     key, data, flags, F_ISSET(dbp, DB_AM_RDONLY), 0)) != 0)
  187. return (ret);
  188. /* Allocate a cursor. */
  189. if ((ret = dbp->cursor(dbp, txn, &dbc, DB_WRITELOCK)) != 0)
  190. return (ret);
  191. DEBUG_LWRITE(dbc, txn, "ram_put", key, data, flags);
  192. /*
  193.  * If we're appending to the tree, make sure we've read in all of
  194.  * the backing source file.  Otherwise, check the user's record
  195.  * number and fill in as necessary.  If we found the record or it
  196.  * simply didn't exist, add the user's record.
  197.  */
  198. if (flags == DB_APPEND)
  199. ret = __ram_update(dbc, DB_MAX_RECORDS, 0);
  200. else
  201. ret = __ram_getno(dbc, key, &recno, 1);
  202. if (ret == 0 || ret == DB_NOTFOUND)
  203. ret = __ram_add(dbc, &recno, data, flags, 0);
  204. /* Discard the cursor. */
  205. if ((t_ret = dbc->c_close(dbc)) != 0 && ret == 0)
  206. ret = t_ret;
  207. /* Return the record number if we're appending to the tree. */
  208. if (ret == 0 && flags == DB_APPEND)
  209. ret = __db_retcopy(dbp, key, &recno, sizeof(recno),
  210.     &dbc->rkey.data, &dbc->rkey.ulen);
  211. return (ret);
  212. }
  213. /*
  214.  * __ram_c_del --
  215.  * Recno cursor->c_del function.
  216.  *
  217.  * PUBLIC: int __ram_c_del __P((DBC *));
  218.  */
  219. int
  220. __ram_c_del(dbc)
  221. DBC *dbc;
  222. {
  223. BKEYDATA bk;
  224. BTREE *t;
  225. BTREE_CURSOR *cp;
  226. DB *dbp;
  227. DB_LSN lsn;
  228. DBT hdr, data;
  229. EPG *epg;
  230. int exact, ret, stack;
  231. dbp = dbc->dbp;
  232. cp = (BTREE_CURSOR *)dbc->internal;
  233. t = dbp->bt_internal;
  234. stack = 0;
  235. /*
  236.  * The semantics of cursors during delete are as follows: in
  237.  * non-renumbering recnos, records are replaced with a marker
  238.  * containing a delete flag.  If the record referenced by this cursor
  239.  * has already been deleted, we will detect that as part of the delete
  240.  * operation, and fail.
  241.  *
  242.  * In renumbering recnos, cursors which represent deleted items
  243.  * are flagged with the C_DELETED flag, and it is an error to
  244.  * call c_del a second time without an intervening cursor motion.
  245.  */
  246. if (CD_ISSET(cp))
  247. return (DB_KEYEMPTY);
  248. /* Search the tree for the key; delete only deletes exact matches. */
  249. if ((ret = __bam_rsearch(dbc, &cp->recno, S_DELETE, 1, &exact)) != 0)
  250. goto err;
  251. if (!exact) {
  252. ret = DB_NOTFOUND;
  253. goto err;
  254. }
  255. stack = 1;
  256. cp->page = cp->csp->page;
  257. cp->pgno = cp->csp->page->pgno;
  258. cp->indx = cp->csp->indx;
  259. /*
  260.  * If re-numbering records, the on-page deleted flag can only mean
  261.  * that this record was implicitly created.  Applications aren't
  262.  * permitted to delete records they never created, return an error.
  263.  *
  264.  * If not re-numbering records, the on-page deleted flag means that
  265.  * this record was implicitly created, or, was deleted at some time.
  266.  * The former is an error because applications aren't permitted to
  267.  * delete records they never created, the latter is an error because
  268.  * if the record was "deleted", we could never have found it.
  269.  */
  270. if (B_DISSET(GET_BKEYDATA(cp->page, cp->indx)->type)) {
  271. ret = DB_KEYEMPTY;
  272. goto err;
  273. }
  274. if (F_ISSET(cp, C_RENUMBER)) {
  275. /* Delete the item, adjust the counts, adjust the cursors. */
  276. if ((ret = __bam_ditem(dbc, cp->page, cp->indx)) != 0)
  277. goto err;
  278. __bam_adjust(dbc, -1);
  279. if (__ram_ca(dbc, CA_DELETE) > 0 &&
  280.     CURADJ_LOG(dbc) && (ret = __bam_rcuradj_log(dbp->dbenv,
  281.     dbc->txn, &lsn, 0, dbp->log_fileid, CA_DELETE,
  282.     cp->root, cp->recno, cp->order)) != 0)
  283. goto err;
  284. /*
  285.  * If the page is empty, delete it.
  286.  *
  287.  * We never delete a root page.  First, root pages of primary
  288.  * databases never go away, recno or otherwise.  However, if
  289.  * it's the root page of an off-page duplicates database, then
  290.  * it can be deleted.   We don't delete it here because we have
  291.  * no way of telling the primary database page holder (e.g.,
  292.  * the hash access method) that its page element should cleaned
  293.  * up because the underlying tree is gone.  So, we keep the page
  294.  * around until the last cursor referencing the empty tree is
  295.  * are closed, and then clean it up.
  296.  */
  297. if (NUM_ENT(cp->page) == 0 && PGNO(cp->page) != cp->root) {
  298. /*
  299.  * We already have a locked stack of pages.  However,
  300.  * there are likely entries in the stack that aren't
  301.  * going to be emptied by removing the single reference
  302.  * to the emptied page (or one of its parents).
  303.  */
  304. for (epg = cp->sp; epg <= cp->csp; ++epg)
  305. if (NUM_ENT(epg->page) <= 1)
  306. break;
  307. /*
  308.  * We want to delete a single item out of the last page
  309.  * that we're not deleting, back up to that page.
  310.  */
  311. ret = __bam_dpages(dbc, --epg);
  312. /*
  313.  * Regardless of the return from __bam_dpages, it will
  314.  * discard our stack and pinned page.
  315.  */
  316. stack = 0;
  317. cp->page = NULL;
  318. }
  319. } else {
  320. /* Use a delete/put pair to replace the record with a marker. */
  321. if ((ret = __bam_ditem(dbc, cp->page, cp->indx)) != 0)
  322. goto err;
  323. B_TSET(bk.type, B_KEYDATA, 1);
  324. bk.len = 0;
  325. memset(&hdr, 0, sizeof(hdr));
  326. hdr.data = &bk;
  327. hdr.size = SSZA(BKEYDATA, data);
  328. memset(&data, 0, sizeof(data));
  329. data.data = (void *)"";
  330. data.size = 0;
  331. if ((ret = __db_pitem(dbc,
  332.     cp->page, cp->indx, BKEYDATA_SIZE(0), &hdr, &data)) != 0)
  333. goto err;
  334. }
  335. t->re_modified = 1;
  336. err: if (stack)
  337. __bam_stkrel(dbc, STK_CLRDBC);
  338. return (ret);
  339. }
  340. /*
  341.  * __ram_c_get --
  342.  * Recno cursor->c_get function.
  343.  *
  344.  * PUBLIC: int __ram_c_get
  345.  * PUBLIC:     __P((DBC *, DBT *, DBT *, u_int32_t, db_pgno_t *));
  346.  */
  347. int
  348. __ram_c_get(dbc, key, data, flags, pgnop)
  349. DBC *dbc;
  350. DBT *key, *data;
  351. u_int32_t flags;
  352. db_pgno_t *pgnop;
  353. {
  354. BTREE_CURSOR *cp;
  355. DB *dbp;
  356. int cmp, exact, ret;
  357. COMPQUIET(pgnop, NULL);
  358. dbp = dbc->dbp;
  359. cp = (BTREE_CURSOR *)dbc->internal;
  360. retry: switch (flags) {
  361. case DB_CURRENT:
  362. /*
  363.  * If we're using mutable records and the deleted flag is
  364.  * set, the cursor is pointing at a nonexistent record;
  365.  * return an error.
  366.  */
  367. if (CD_ISSET(cp))
  368. return (DB_KEYEMPTY);
  369. break;
  370. case DB_NEXT_DUP:
  371. /*
  372.  * If we're not in an off-page dup set, we know there's no
  373.  * next duplicate since recnos don't have them.  If we
  374.  * are in an off-page dup set, the next item assuredly is
  375.  * a dup, so we set flags to DB_NEXT and keep going.
  376.  */
  377. if (!F_ISSET(dbc, DBC_OPD))
  378. return (DB_NOTFOUND);
  379. /* FALLTHROUGH */
  380. case DB_NEXT_NODUP:
  381. /*
  382.  * Recno databases don't have duplicates, set flags to DB_NEXT
  383.  * and keep going.
  384.  */
  385. /* FALLTHROUGH */
  386. case DB_NEXT:
  387. flags = DB_NEXT;
  388. /*
  389.  * If record numbers are mutable: if we just deleted a record,
  390.  * we have to avoid incrementing the record number so that we
  391.  * return the right record by virtue of renumbering the tree.
  392.  */
  393. if (CD_ISSET(cp))
  394. break;
  395. if (cp->recno != RECNO_OOB) {
  396. ++cp->recno;
  397. break;
  398. }
  399. /* FALLTHROUGH */
  400. case DB_FIRST:
  401. flags = DB_NEXT;
  402. cp->recno = 1;
  403. break;
  404. case DB_PREV_NODUP:
  405. /*
  406.  * Recno databases don't have duplicates, set flags to DB_PREV
  407.  * and keep going.
  408.  */
  409. /* FALLTHROUGH */
  410. case DB_PREV:
  411. flags = DB_PREV;
  412. if (cp->recno != RECNO_OOB) {
  413. if (cp->recno == 1) {
  414. ret = DB_NOTFOUND;
  415. goto err;
  416. }
  417. --cp->recno;
  418. break;
  419. }
  420. /* FALLTHROUGH */
  421. case DB_LAST:
  422. flags = DB_PREV;
  423. if (((ret = __ram_update(dbc,
  424.     DB_MAX_RECORDS, 0)) != 0) && ret != DB_NOTFOUND)
  425. goto err;
  426. if ((ret = __bam_nrecs(dbc, &cp->recno)) != 0)
  427. goto err;
  428. if (cp->recno == 0) {
  429. ret = DB_NOTFOUND;
  430. goto err;
  431. }
  432. break;
  433. case DB_GET_BOTHC:
  434. /*
  435.  * If we're doing a join and these are offpage dups,
  436.  * we want to keep searching forward from after the
  437.  * current cursor position.  Increment the recno by 1,
  438.  * then proceed as for a DB_SET.
  439.  *
  440.  * Otherwise, we know there are no additional matching
  441.  * data, as recnos don't have dups.  return DB_NOTFOUND.
  442.  */
  443. if (F_ISSET(dbc, DBC_OPD)) {
  444. cp->recno++;
  445. break;
  446. }
  447. ret = DB_NOTFOUND;
  448. goto err;
  449. /* NOTREACHED */
  450. case DB_GET_BOTH:
  451. /*
  452.  * If we're searching a set of off-page dups, we start
  453.  * a new linear search from the first record.  Otherwise,
  454.  * we compare the single data item associated with the
  455.  * requested record for a match.
  456.  */
  457. if (F_ISSET(dbc, DBC_OPD)) {
  458. cp->recno = 1;
  459. break;
  460. }
  461. /* FALLTHROUGH */
  462. case DB_SET:
  463. case DB_SET_RANGE:
  464. if ((ret = __ram_getno(dbc, key, &cp->recno, 0)) != 0)
  465. goto err;
  466. break;
  467. default:
  468. ret = __db_unknown_flag(dbp->dbenv, "__ram_c_get", flags);
  469. goto err;
  470. }
  471. /*
  472.  * For DB_PREV, DB_LAST, DB_SET and DB_SET_RANGE, we have already
  473.  * called __ram_update() to make sure sufficient records have been
  474.  * read from the backing source file.  Do it now for DB_CURRENT (if
  475.  * the current record was deleted we may need more records from the
  476.  * backing file for a DB_CURRENT operation), DB_FIRST and DB_NEXT.
  477.  */
  478. if ((flags == DB_NEXT || flags == DB_CURRENT) && ((ret =
  479.     __ram_update(dbc, cp->recno, 0)) != 0) && ret != DB_NOTFOUND)
  480. goto err;
  481. for (;; ++cp->recno) {
  482. /* Search the tree for the record. */
  483. if ((ret = __bam_rsearch(dbc, &cp->recno,
  484.     F_ISSET(dbc, DBC_RMW) ? S_FIND_WR : S_FIND,
  485.     1, &exact)) != 0)
  486. goto err;
  487. if (!exact) {
  488. ret = DB_NOTFOUND;
  489. goto err;
  490. }
  491. /*
  492.  * Copy the page into the cursor, discarding any lock we
  493.  * are currently holding.
  494.  */
  495. cp->page = cp->csp->page;
  496. cp->pgno = cp->csp->page->pgno;
  497. cp->indx = cp->csp->indx;
  498. (void)__TLPUT(dbc, cp->lock);
  499. cp->lock = cp->csp->lock;
  500. cp->lock_mode = cp->csp->lock_mode;
  501. /*
  502.  * If re-numbering records, the on-page deleted flag means this
  503.  * record was implicitly created.  If not re-numbering records,
  504.  * the on-page deleted flag means this record was implicitly
  505.  * created, or, it was deleted at some time.  Regardless, we
  506.  * skip such records if doing cursor next/prev operations or
  507.  * walking through off-page duplicates, and fail if they were
  508.  * requested explicitly by the application.
  509.  */
  510. if (B_DISSET(GET_BKEYDATA(cp->page, cp->indx)->type))
  511. switch (flags) {
  512. case DB_NEXT:
  513. case DB_PREV:
  514. (void)__bam_stkrel(dbc, STK_CLRDBC);
  515. goto retry;
  516. case DB_GET_BOTH:
  517. (void)__bam_stkrel(dbc, STK_CLRDBC);
  518. continue;
  519. default:
  520. ret = DB_KEYEMPTY;
  521. goto err;
  522. }
  523. if (flags == DB_GET_BOTH || flags == DB_GET_BOTHC) {
  524. if ((ret = __bam_cmp(dbp, data,
  525.     cp->page, cp->indx, __bam_defcmp, &cmp)) != 0)
  526. return (ret);
  527. if (cmp == 0)
  528. break;
  529. if (!F_ISSET(dbc, DBC_OPD)) {
  530. ret = DB_NOTFOUND;
  531. goto err;
  532. }
  533. (void)__bam_stkrel(dbc, STK_CLRDBC);
  534. } else
  535. break;
  536. }
  537. /* Return the key if the user didn't give us one. */
  538. if (!F_ISSET(dbc, DBC_OPD)) {
  539. if (flags != DB_SET && flags != DB_SET_RANGE)
  540. ret = __db_retcopy(dbp,
  541.      key, &cp->recno, sizeof(cp->recno),
  542.      &dbc->rkey.data, &dbc->rkey.ulen);
  543. F_SET(key, DB_DBT_ISSET);
  544. }
  545. /* The cursor was reset, no further delete adjustment is necessary. */
  546. err: CD_CLR(cp);
  547. return (ret);
  548. }
  549. /*
  550.  * __ram_c_put --
  551.  * Recno cursor->c_put function.
  552.  *
  553.  * PUBLIC: int __ram_c_put __P((DBC *, DBT *, DBT *, u_int32_t, db_pgno_t *));
  554.  */
  555. int
  556. __ram_c_put(dbc, key, data, flags, pgnop)
  557. DBC *dbc;
  558. DBT *key, *data;
  559. u_int32_t flags;
  560. db_pgno_t *pgnop;
  561. {
  562. BTREE_CURSOR *cp;
  563. DB *dbp;
  564. DB_LSN lsn;
  565. int exact, nc, ret, t_ret;
  566. u_int32_t iiflags;
  567. void *arg;
  568. COMPQUIET(pgnop, NULL);
  569. dbp = dbc->dbp;
  570. cp = (BTREE_CURSOR *)dbc->internal;
  571. /*
  572.  * DB_KEYFIRST and DB_KEYLAST will only be set if we're dealing with
  573.  * an off-page duplicate tree, they can't be specified at user level.
  574.  * Translate them into something else.
  575.  */
  576. switch (flags) {
  577. case DB_KEYFIRST:
  578. cp->recno = 1;
  579. flags = DB_BEFORE;
  580. break;
  581. case DB_KEYLAST:
  582. if ((ret = __ram_add(dbc, &cp->recno, data, DB_APPEND, 0)) != 0)
  583. return (ret);
  584. if (CURADJ_LOG(dbc) && (ret = __bam_rcuradj_log(dbp->dbenv,
  585.     dbc->txn, &lsn, 0, dbp->log_fileid, CA_ICURRENT,
  586.     cp->root, cp->recno, cp->order)))
  587. return (ret);
  588. return (0);
  589. }
  590. /*
  591.  * If we're putting with a cursor that's marked C_DELETED, we need to
  592.  * take special care;  the cursor doesn't "really" reference the item
  593.  * corresponding to its current recno, but instead is "between" that
  594.  * record and the current one.  Translate the actual insert into
  595.  * DB_BEFORE, and let the __ram_ca work out the gory details of what
  596.  * should wind up pointing where.
  597.  */
  598. if (CD_ISSET(cp))
  599. iiflags = DB_BEFORE;
  600. else
  601. iiflags = flags;
  602. split: if ((ret = __bam_rsearch(dbc, &cp->recno, S_INSERT, 1, &exact)) != 0)
  603. goto err;
  604. /*
  605.  * An inexact match is okay;  it just means we're one record past the
  606.  * end, which is reasonable if we're marked deleted.
  607.  */
  608. DB_ASSERT(exact || CD_ISSET(cp));
  609. cp->page = cp->csp->page;
  610. cp->pgno = cp->csp->page->pgno;
  611. cp->indx = cp->csp->indx;
  612. ret = __bam_iitem(dbc, key, data, iiflags, 0);
  613. t_ret = __bam_stkrel(dbc, STK_CLRDBC);
  614. if (t_ret != 0 && (ret == 0 || ret == DB_NEEDSPLIT))
  615. ret = t_ret;
  616. else if (ret == DB_NEEDSPLIT) {
  617. arg = &cp->recno;
  618. if ((ret = __bam_split(dbc, arg)) != 0)
  619. goto err;
  620. goto split;
  621. }
  622. if (ret != 0)
  623. goto err;
  624. switch (flags) { /* Adjust the cursors. */
  625. case DB_AFTER:
  626. nc = __ram_ca(dbc, CA_IAFTER);
  627. /*
  628.  * We only need to adjust this cursor forward if we truly added
  629.  * the item after the current recno, rather than remapping it
  630.  * to DB_BEFORE.
  631.  */
  632. if (iiflags == DB_AFTER)
  633. ++cp->recno;
  634. /* Only log if __ram_ca found any relevant cursors. */
  635. if (nc > 0 && CURADJ_LOG(dbc) &&
  636.     (ret = __bam_rcuradj_log(dbp->dbenv,
  637.     dbc->txn, &lsn, 0, dbp->log_fileid, CA_IAFTER,
  638.     cp->root, cp->recno, cp->order)) != 0)
  639. goto err;
  640. break;
  641. case DB_BEFORE:
  642. nc = __ram_ca(dbc, CA_IBEFORE);
  643. --cp->recno;
  644. /* Only log if __ram_ca found any relevant cursors. */
  645. if (nc > 0 && CURADJ_LOG(dbc) &&
  646.     (ret = __bam_rcuradj_log(dbp->dbenv,
  647.     dbc->txn, &lsn, 0, dbp->log_fileid, CA_IBEFORE,
  648.     cp->root, cp->recno, cp->order)) != 0)
  649. goto err;
  650. break;
  651. case DB_CURRENT:
  652. /*
  653.  * We only need to do an adjustment if we actually
  654.  * added an item, which we only would have done if the
  655.  * cursor was marked deleted.
  656.  *
  657.  * Only log if __ram_ca found any relevant cursors.
  658.  */
  659. if (CD_ISSET(cp) && __ram_ca(dbc, CA_ICURRENT) > 0 &&
  660.     CURADJ_LOG(dbc) && (ret = __bam_rcuradj_log(
  661.     dbp->dbenv, dbc->txn, &lsn, 0, dbp->log_fileid,
  662.     CA_ICURRENT, cp->root, cp->recno, cp->order)) != 0)
  663. goto err;
  664. break;
  665. }
  666. /* Return the key if we've created a new record. */
  667. if (!F_ISSET(dbc, DBC_OPD) && (flags == DB_AFTER || flags == DB_BEFORE))
  668. ret = __db_retcopy(dbp, key, &cp->recno,
  669.     sizeof(cp->recno), &dbc->rkey.data, &dbc->rkey.ulen);
  670. /* The cursor was reset, no further delete adjustment is necessary. */
  671. err: CD_CLR(cp);
  672. return (ret);
  673. }
  674. /*
  675.  * __ram_ca --
  676.  * Adjust cursors.  Returns the number of relevant cursors.
  677.  *
  678.  * PUBLIC: int __ram_ca __P((DBC *, ca_recno_arg));
  679.  */
  680. int
  681. __ram_ca(dbc_arg, op)
  682. DBC *dbc_arg;
  683. ca_recno_arg op;
  684. {
  685. BTREE_CURSOR *cp, *cp_arg;
  686. DB *dbp, *ldbp;
  687. DB_ENV *dbenv;
  688. DBC *dbc;
  689. db_recno_t recno;
  690. int adjusted, found;
  691. u_int32_t order;
  692. dbp = dbc_arg->dbp;
  693. dbenv = dbp->dbenv;
  694. cp_arg = (BTREE_CURSOR *)dbc_arg->internal;
  695. recno = cp_arg->recno;
  696. found = 0;
  697. /*
  698.  * It only makes sense to adjust cursors if we're a renumbering
  699.  * recno;  we should only be called if this is one.
  700.  */
  701. DB_ASSERT(F_ISSET(cp_arg, C_RENUMBER));
  702. MUTEX_THREAD_LOCK(dbenv, dbenv->dblist_mutexp);
  703. /*
  704.  * Adjust the cursors.  See the comment in __bam_ca_delete().
  705.  */
  706. /*
  707.  * If we're doing a delete, we need to find the highest
  708.  * order of any cursor currently pointing at this item,
  709.  * so we can assign a higher order to the newly deleted
  710.  * cursor.  Unfortunately, this requires a second pass through
  711.  * the cursor list.
  712.  */
  713. if (op == CA_DELETE) {
  714. order = 1;
  715. for (ldbp = __dblist_get(dbenv, dbp->adj_fileid);
  716.     ldbp != NULL && ldbp->adj_fileid == dbp->adj_fileid;
  717.     ldbp = LIST_NEXT(ldbp, dblistlinks)) {
  718. MUTEX_THREAD_LOCK(dbenv, dbp->mutexp);
  719. for (dbc = TAILQ_FIRST(&ldbp->active_queue);
  720.     dbc != NULL; dbc = TAILQ_NEXT(dbc, links)) {
  721. cp = (BTREE_CURSOR *)dbc->internal;
  722. if (cp_arg->root == cp->root &&
  723.     recno == cp->recno && CD_ISSET(cp) &&
  724.     order <= cp->order)
  725. order = cp->order + 1;
  726. }
  727. MUTEX_THREAD_UNLOCK(dbenv, dbp->mutexp);
  728. }
  729. } else
  730. order = INVALID_ORDER;
  731. /* Now go through and do the actual adjustments. */
  732. for (ldbp = __dblist_get(dbenv, dbp->adj_fileid);
  733.     ldbp != NULL && ldbp->adj_fileid == dbp->adj_fileid;
  734.     ldbp = LIST_NEXT(ldbp, dblistlinks)) {
  735. MUTEX_THREAD_LOCK(dbenv, dbp->mutexp);
  736. for (dbc = TAILQ_FIRST(&ldbp->active_queue);
  737.     dbc != NULL; dbc = TAILQ_NEXT(dbc, links)) {
  738. cp = (BTREE_CURSOR *)dbc->internal;
  739. if (cp_arg->root != cp->root)
  740. continue;
  741. ++found;
  742. adjusted = 0;
  743. switch (op) {
  744. case CA_DELETE:
  745. if (recno < cp->recno) {
  746. --cp->recno;
  747. /*
  748.  * If the adjustment made them equal,
  749.  * we have to merge the orders.
  750.  */
  751. if (recno == cp->recno && CD_ISSET(cp))
  752. cp->order += order;
  753. } else if (recno == cp->recno &&
  754.     !CD_ISSET(cp)) {
  755. CD_SET(cp);
  756. cp->order = order;
  757. }
  758. break;
  759. case CA_IBEFORE:
  760. /*
  761.  * IBEFORE is just like IAFTER, except that we
  762.  * adjust cursors on the current record too.
  763.  */
  764. if (C_EQUAL(cp_arg, cp)) {
  765. ++cp->recno;
  766. adjusted = 1;
  767. }
  768. goto iafter;
  769. case CA_ICURRENT:
  770. /*
  771.  * If the original cursor wasn't deleted, we
  772.  * just did a replacement and so there's no
  773.  * need to adjust anything--we shouldn't have
  774.  * gotten this far.  Otherwise, we behave
  775.  * much like an IAFTER, except that all
  776.  * cursors pointing to the current item get
  777.  * marked undeleted and point to the new
  778.  * item.
  779.  */
  780. DB_ASSERT(CD_ISSET(cp_arg));
  781. if (C_EQUAL(cp_arg, cp)) {
  782. CD_CLR(cp);
  783. break;
  784. }
  785. /* FALLTHROUGH */
  786. case CA_IAFTER:
  787. iafter: if (!adjusted && C_LESSTHAN(cp_arg, cp)) {
  788. ++cp->recno;
  789. adjusted = 1;
  790. }
  791. if (recno == cp->recno && adjusted)
  792. /*
  793.  * If we've moved this cursor's recno,
  794.  * split its order number--i.e.,
  795.  * decrement it by enough so that
  796.  * the lowest cursor moved has order 1.
  797.  * cp_arg->order is the split point,
  798.  * so decrement by one less than that.
  799.  */
  800. cp->order -= (cp_arg->order - 1);
  801. break;
  802. }
  803. }
  804. MUTEX_THREAD_UNLOCK(dbp->dbenv, dbp->mutexp);
  805. }
  806. MUTEX_THREAD_UNLOCK(dbenv, dbenv->dblist_mutexp);
  807. return (found);
  808. }
  809. /*
  810.  * __ram_getno --
  811.  * Check the user's record number, and make sure we've seen it.
  812.  *
  813.  * PUBLIC: int __ram_getno __P((DBC *, const DBT *, db_recno_t *, int));
  814.  */
  815. int
  816. __ram_getno(dbc, key, rep, can_create)
  817. DBC *dbc;
  818. const DBT *key;
  819. db_recno_t *rep;
  820. int can_create;
  821. {
  822. DB *dbp;
  823. db_recno_t recno;
  824. dbp = dbc->dbp;
  825. /* Check the user's record number. */
  826. if ((recno = *(db_recno_t *)key->data) == 0) {
  827. __db_err(dbp->dbenv, "illegal record number of 0");
  828. return (EINVAL);
  829. }
  830. if (rep != NULL)
  831. *rep = recno;
  832. /*
  833.  * Btree can neither create records nor read them in.  Recno can
  834.  * do both, see if we can find the record.
  835.  */
  836. return (dbc->dbtype == DB_RECNO ?
  837.     __ram_update(dbc, recno, can_create) : 0);
  838. }
  839. /*
  840.  * __ram_update --
  841.  * Ensure the tree has records up to and including the specified one.
  842.  */
  843. static int
  844. __ram_update(dbc, recno, can_create)
  845. DBC *dbc;
  846. db_recno_t recno;
  847. int can_create;
  848. {
  849. BTREE *t;
  850. BTREE_CURSOR *cp;
  851. DB *dbp;
  852. db_recno_t nrecs;
  853. int ret;
  854. dbp = dbc->dbp;
  855. cp = (BTREE_CURSOR *)dbc->internal;
  856. t = dbp->bt_internal;
  857. /*
  858.  * If we can't create records and we've read the entire backing input
  859.  * file, we're done.
  860.  */
  861. if (!can_create && t->re_eof)
  862. return (0);
  863. /*
  864.  * If we haven't seen this record yet, try to get it from the original
  865.  * file.
  866.  */
  867. if ((ret = __bam_nrecs(dbc, &nrecs)) != 0)
  868. return (ret);
  869. if (!t->re_eof && recno > nrecs) {
  870. if ((ret = __ram_sread(dbc, recno)) != 0 && ret != DB_NOTFOUND)
  871. return (ret);
  872. if ((ret = __bam_nrecs(dbc, &nrecs)) != 0)
  873. return (ret);
  874. }
  875. /*
  876.  * If we can create records, create empty ones up to the requested
  877.  * record.
  878.  */
  879. if (!can_create || recno <= nrecs + 1)
  880. return (0);
  881. dbc->rdata.dlen = 0;
  882. dbc->rdata.doff = 0;
  883. dbc->rdata.flags = 0;
  884. if (F_ISSET(dbp, DB_RE_FIXEDLEN)) {
  885. if (dbc->rdata.ulen < t->re_len) {
  886. if ((ret = __os_realloc(dbp->dbenv,
  887.     t->re_len, NULL, &dbc->rdata.data)) != 0) {
  888. dbc->rdata.ulen = 0;
  889. dbc->rdata.data = NULL;
  890. return (ret);
  891. }
  892. dbc->rdata.ulen = t->re_len;
  893. }
  894. dbc->rdata.size = t->re_len;
  895. memset(dbc->rdata.data, t->re_pad, t->re_len);
  896. } else
  897. dbc->rdata.size = 0;
  898. while (recno > ++nrecs)
  899. if ((ret = __ram_add(dbc,
  900.     &nrecs, &dbc->rdata, 0, BI_DELETED)) != 0)
  901. return (ret);
  902. return (0);
  903. }
  904. /*
  905.  * __ram_source --
  906.  * Load information about the backing file.
  907.  */
  908. static int
  909. __ram_source(dbp)
  910. DB *dbp;
  911. {
  912. BTREE *t;
  913. char *source;
  914. int ret;
  915. t = dbp->bt_internal;
  916. /* Find the real name, and swap out the one we had before. */
  917. if ((ret = __db_appname(dbp->dbenv,
  918.     DB_APP_DATA, NULL, t->re_source, 0, NULL, &source)) != 0)
  919. return (ret);
  920. __os_freestr(t->re_source);
  921. t->re_source = source;
  922. /*
  923.  * !!!
  924.  * It's possible that the backing source file is read-only.  We don't
  925.  * much care other than we'll complain if there are any modifications
  926.  * when it comes time to write the database back to the source.
  927.  */
  928. if ((t->re_fp = fopen(t->re_source, "r")) == NULL) {
  929. ret = errno;
  930. __db_err(dbp->dbenv, "%s: %s", t->re_source, db_strerror(ret));
  931. return (ret);
  932. }
  933. t->re_eof = 0;
  934. return (0);
  935. }
  936. /*
  937.  * __ram_writeback --
  938.  * Rewrite the backing file.
  939.  *
  940.  * PUBLIC: int __ram_writeback __P((DB *));
  941.  */
  942. int
  943. __ram_writeback(dbp)
  944. DB *dbp;
  945. {
  946. BTREE *t;
  947. DB_ENV *dbenv;
  948. DBC *dbc;
  949. DBT key, data;
  950. FILE *fp;
  951. db_recno_t keyno;
  952. int ret, t_ret;
  953. u_int8_t delim, *pad;
  954. t = dbp->bt_internal;
  955. dbenv = dbp->dbenv;
  956. fp = NULL;
  957. /* If the file wasn't modified, we're done. */
  958. if (!t->re_modified)
  959. return (0);
  960. /* If there's no backing source file, we're done. */
  961. if (t->re_source == NULL) {
  962. t->re_modified = 0;
  963. return (0);
  964. }
  965. /* Allocate a cursor. */
  966. if ((ret = dbp->cursor(dbp, NULL, &dbc, 0)) != 0)
  967. return (ret);
  968. /*
  969.  * Read any remaining records into the tree.
  970.  *
  971.  * !!!
  972.  * This is why we can't support transactions when applications specify
  973.  * backing (re_source) files.  At this point we have to read in the
  974.  * rest of the records from the file so that we can write all of the
  975.  * records back out again, which could modify a page for which we'd
  976.  * have to log changes and which we don't have locked.  This could be
  977.  * partially fixed by taking a snapshot of the entire file during the
  978.  * DB->open as DB->open is transaction protected.  But, if a checkpoint
  979.  * occurs then, the part of the log holding the copy of the file could
  980.  * be discarded, and that would make it impossible to recover in the
  981.  * face of disaster.  This could all probably be fixed, but it would
  982.  * require transaction protecting the backing source file.
  983.  *
  984.  * XXX
  985.  * This could be made to work now that we have transactions protecting
  986.  * file operations.  Margo has specifically asked for the privilege of
  987.  * doing this work.
  988.  */
  989. if ((ret =
  990.     __ram_update(dbc, DB_MAX_RECORDS, 0)) != 0 && ret != DB_NOTFOUND)
  991. return (ret);
  992. /*
  993.  * Close any existing file handle and re-open the file, truncating it.
  994.  */
  995. if (t->re_fp != NULL) {
  996. if (fclose(t->re_fp) != 0) {
  997. ret = errno;
  998. goto err;
  999. }
  1000. t->re_fp = NULL;
  1001. }
  1002. if ((fp = fopen(t->re_source, "w")) == NULL) {
  1003. ret = errno;
  1004. __db_err(dbenv, "%s: %s", t->re_source, db_strerror(ret));
  1005. goto err;
  1006. }
  1007. /*
  1008.  * We step through the records, writing each one out.  Use the record
  1009.  * number and the dbp->get() function, instead of a cursor, so we find
  1010.  * and write out "deleted" or non-existent records.
  1011.  */
  1012. memset(&key, 0, sizeof(key));
  1013. memset(&data, 0, sizeof(data));
  1014. key.size = sizeof(db_recno_t);
  1015. key.data = &keyno;
  1016. /*
  1017.  * We'll need the delimiter if we're doing variable-length records,
  1018.  * and the pad character if we're doing fixed-length records.
  1019.  */
  1020. delim = t->re_delim;
  1021. if (F_ISSET(dbp, DB_RE_FIXEDLEN)) {
  1022. if ((ret = __os_malloc(dbenv, t->re_len, NULL, &pad)) != 0)
  1023. goto err;
  1024. memset(pad, t->re_pad, t->re_len);
  1025. } else
  1026. COMPQUIET(pad, NULL);
  1027. for (keyno = 1;; ++keyno) {
  1028. switch (ret = dbp->get(dbp, NULL, &key, &data, 0)) {
  1029. case 0:
  1030. if (fwrite(data.data, 1, data.size, fp) != data.size)
  1031. goto write_err;
  1032. break;
  1033. case DB_KEYEMPTY:
  1034. if (F_ISSET(dbp, DB_RE_FIXEDLEN) &&
  1035.     fwrite(pad, 1, t->re_len, fp) != t->re_len)
  1036. goto write_err;
  1037. break;
  1038. case DB_NOTFOUND:
  1039. ret = 0;
  1040. goto done;
  1041. }
  1042. if (!F_ISSET(dbp, DB_RE_FIXEDLEN) &&
  1043.     fwrite(&delim, 1, 1, fp) != 1) {
  1044. write_err: ret = errno;
  1045. __db_err(dbp->dbenv,
  1046.     "%s: write failed to backing file: %s",
  1047.     t->re_source, strerror(ret));
  1048. goto err;
  1049. }
  1050. }
  1051. err:
  1052. done: /* Close the file descriptor. */
  1053. if (fp != NULL && fclose(fp) != 0) {
  1054. if (ret == 0)
  1055. ret = errno;
  1056. __db_err(dbenv, "%s: %s", t->re_source, db_strerror(errno));
  1057. }
  1058. /* Discard the cursor. */
  1059. if ((t_ret = dbc->c_close(dbc)) != 0 && ret == 0)
  1060. ret = t_ret;
  1061. if (ret == 0)
  1062. t->re_modified = 0;
  1063. return (ret);
  1064. }
  1065. /*
  1066.  * __ram_sread --
  1067.  * Read records from a source file.
  1068.  */
  1069. static int
  1070. __ram_sread(dbc, top)
  1071. DBC *dbc;
  1072. db_recno_t top;
  1073. {
  1074. BTREE *t;
  1075. DB *dbp;
  1076. DBT data;
  1077. db_recno_t recno;
  1078. size_t len;
  1079. int ch, ret, was_modified;
  1080. t = dbc->dbp->bt_internal;
  1081. dbp = dbc->dbp;
  1082. was_modified = t->re_modified;
  1083. if ((ret = __bam_nrecs(dbc, &recno)) != 0)
  1084. return (ret);
  1085. /* Use the record data return memory, it's only a short-term use. */
  1086. len = F_ISSET(dbp, DB_RE_FIXEDLEN) ? t->re_len : 256;
  1087. if (dbc->rdata.ulen < len) {
  1088. if ((ret = __os_realloc(
  1089.     dbp->dbenv, len, NULL, &dbc->rdata.data)) != 0) {
  1090. dbc->rdata.ulen = 0;
  1091. dbc->rdata.data = NULL;
  1092. return (ret);
  1093. }
  1094. dbc->rdata.ulen = len;
  1095. }
  1096. memset(&data, 0, sizeof(data));
  1097. while (recno < top) {
  1098. data.data = dbc->rdata.data;
  1099. data.size = 0;
  1100. if (F_ISSET(dbp, DB_RE_FIXEDLEN))
  1101. for (len = t->re_len; len > 0; --len) {
  1102. if ((ch = getc(t->re_fp)) == EOF)
  1103. goto eof;
  1104. ((u_int8_t *)data.data)[data.size++] = ch;
  1105. }
  1106. else
  1107. for (;;) {
  1108. if ((ch = getc(t->re_fp)) == EOF)
  1109. goto eof;
  1110. if (ch == t->re_delim)
  1111. break;
  1112. ((u_int8_t *)data.data)[data.size++] = ch;
  1113. if (data.size == dbc->rdata.ulen) {
  1114. if ((ret = __os_realloc(dbp->dbenv,
  1115.     dbc->rdata.ulen *= 2,
  1116.     NULL, &dbc->rdata.data)) != 0) {
  1117. dbc->rdata.ulen = 0;
  1118. dbc->rdata.data = NULL;
  1119. return (ret);
  1120. } else
  1121. data.data = dbc->rdata.data;
  1122. }
  1123. }
  1124. /*
  1125.  * Another process may have read this record from the input
  1126.  * file and stored it into the database already, in which
  1127.  * case we don't need to repeat that operation.  We detect
  1128.  * this by checking if the last record we've read is greater
  1129.  * or equal to the number of records in the database.
  1130.  */
  1131. if (t->re_last >= recno) {
  1132. ++recno;
  1133. if ((ret = __ram_add(dbc, &recno, &data, 0, 0)) != 0)
  1134. goto err;
  1135. }
  1136. ++t->re_last;
  1137. }
  1138. if (0) {
  1139. eof: t->re_eof = 1;
  1140. ret = DB_NOTFOUND;
  1141. }
  1142. err: if (!was_modified)
  1143. t->re_modified = 0;
  1144. return (ret);
  1145. }
  1146. /*
  1147.  * __ram_add --
  1148.  * Add records into the tree.
  1149.  */
  1150. static int
  1151. __ram_add(dbc, recnop, data, flags, bi_flags)
  1152. DBC *dbc;
  1153. db_recno_t *recnop;
  1154. DBT *data;
  1155. u_int32_t flags, bi_flags;
  1156. {
  1157. BKEYDATA *bk;
  1158. BTREE_CURSOR *cp;
  1159. int exact, ret, stack;
  1160. cp = (BTREE_CURSOR *)dbc->internal;
  1161. retry: /* Find the slot for insertion. */
  1162. if ((ret = __bam_rsearch(dbc, recnop,
  1163.     S_INSERT | (flags == DB_APPEND ? S_APPEND : 0), 1, &exact)) != 0)
  1164. return (ret);
  1165. stack = 1;
  1166. cp->page = cp->csp->page;
  1167. cp->pgno = cp->csp->page->pgno;
  1168. cp->indx = cp->csp->indx;
  1169. /*
  1170.  * The application may modify the data based on the selected record
  1171.  * number.
  1172.  */
  1173. if (flags == DB_APPEND && dbc->dbp->db_append_recno != NULL &&
  1174.     (ret = dbc->dbp->db_append_recno(dbc->dbp, data, *recnop)) != 0)
  1175. goto err;
  1176. /*
  1177.  * If re-numbering records, the on-page deleted flag means this record
  1178.  * was implicitly created.  If not re-numbering records, the on-page
  1179.  * deleted flag means this record was implicitly created, or, it was
  1180.  * deleted at some time.
  1181.  *
  1182.  * If DB_NOOVERWRITE is set and the item already exists in the tree,
  1183.  * return an error unless the item was either marked for deletion or
  1184.  * only implicitly created.
  1185.  */
  1186. if (exact) {
  1187. bk = GET_BKEYDATA(cp->page, cp->indx);
  1188. if (!B_DISSET(bk->type) && flags == DB_NOOVERWRITE) {
  1189. ret = DB_KEYEXIST;
  1190. goto err;
  1191. }
  1192. }
  1193. /*
  1194.  * Select the arguments for __bam_iitem() and do the insert.  If the
  1195.  * key is an exact match, or we're replacing the data item with a
  1196.  * new data item, replace the current item.  If the key isn't an exact
  1197.  * match, we're inserting a new key/data pair, before the search
  1198.  * location.
  1199.  */
  1200. switch (ret = __bam_iitem(dbc,
  1201.     NULL, data, exact ? DB_CURRENT : DB_BEFORE, bi_flags)) {
  1202. case 0:
  1203. /*
  1204.  * Don't adjust anything.
  1205.  *
  1206.  * If we inserted a record, no cursors need adjusting because
  1207.  * the only new record it's possible to insert is at the very
  1208.  * end of the tree.  The necessary adjustments to the internal
  1209.  * page counts were made by __bam_iitem().
  1210.  *
  1211.  * If we overwrote a record, no cursors need adjusting because
  1212.  * future DBcursor->get calls will simply return the underlying
  1213.  * record (there's no adjustment made for the DB_CURRENT flag
  1214.  * when a cursor get operation immediately follows a cursor
  1215.  * delete operation, and the normal adjustment for the DB_NEXT
  1216.  * flag is still correct).
  1217.  */
  1218. break;
  1219. case DB_NEEDSPLIT:
  1220. /* Discard the stack of pages and split the page. */
  1221. (void)__bam_stkrel(dbc, STK_CLRDBC);
  1222. stack = 0;
  1223. if ((ret = __bam_split(dbc, recnop)) != 0)
  1224. goto err;
  1225. goto retry;
  1226. /* NOTREACHED */
  1227. default:
  1228. goto err;
  1229. }
  1230. err: if (stack)
  1231. __bam_stkrel(dbc, STK_CLRDBC);
  1232. return (ret);
  1233. }