log.c
上传用户:romrleung
上传日期:2022-05-23
资源大小:18897k
文件大小:29k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /*-
  2.  * See the file LICENSE for redistribution information.
  3.  *
  4.  * Copyright (c) 1996-2002
  5.  * Sleepycat Software.  All rights reserved.
  6.  */
  7. #include "db_config.h"
  8. #ifndef lint
  9. static const char revid[] = "$Id: log.c,v 11.111 2002/08/16 00:27:44 ubell Exp $";
  10. #endif /* not lint */
  11. #ifndef NO_SYSTEM_INCLUDES
  12. #include <sys/types.h>
  13. #include <ctype.h>
  14. #include <stdlib.h>
  15. #include <string.h>
  16. #include <unistd.h>
  17. #endif
  18. #include "db_int.h"
  19. #include "dbinc/crypto.h"
  20. #include "dbinc/hmac.h"
  21. #include "dbinc/log.h"
  22. #include "dbinc/txn.h"
  23. static int __log_init __P((DB_ENV *, DB_LOG *));
  24. static int __log_recover __P((DB_LOG *));
  25. static size_t __log_region_size __P((DB_ENV *));
  26. static int __log_zero __P((DB_ENV *, DB_LSN *, DB_LSN *));
  27. /*
  28.  * __log_open --
  29.  * Internal version of log_open: only called from DB_ENV->open.
  30.  *
  31.  * PUBLIC: int __log_open __P((DB_ENV *));
  32.  */
  33. int
  34. __log_open(dbenv)
  35. DB_ENV *dbenv;
  36. {
  37. DB_LOG *dblp;
  38. LOG *lp;
  39. int ret;
  40. /* Create/initialize the DB_LOG structure. */
  41. if ((ret = __os_calloc(dbenv, 1, sizeof(DB_LOG), &dblp)) != 0)
  42. return (ret);
  43. dblp->dbenv = dbenv;
  44. /* Join/create the log region. */
  45. dblp->reginfo.type = REGION_TYPE_LOG;
  46. dblp->reginfo.id = INVALID_REGION_ID;
  47. dblp->reginfo.mode = dbenv->db_mode;
  48. dblp->reginfo.flags = REGION_JOIN_OK;
  49. if (F_ISSET(dbenv, DB_ENV_CREATE))
  50. F_SET(&dblp->reginfo, REGION_CREATE_OK);
  51. if ((ret = __db_r_attach(
  52.     dbenv, &dblp->reginfo, __log_region_size(dbenv))) != 0)
  53. goto err;
  54. /* If we created the region, initialize it. */
  55. if (F_ISSET(&dblp->reginfo, REGION_CREATE))
  56. if ((ret = __log_init(dbenv, dblp)) != 0)
  57. goto err;
  58. /* Set the local addresses. */
  59. lp = dblp->reginfo.primary =
  60.     R_ADDR(&dblp->reginfo, dblp->reginfo.rp->primary);
  61. /*
  62.  * If the region is threaded, then we have to lock both the handles
  63.  * and the region, and we need to allocate a mutex for that purpose.
  64.  */
  65. if (F_ISSET(dbenv, DB_ENV_THREAD) &&
  66.     (ret = __db_mutex_setup(dbenv, &dblp->reginfo, &dblp->mutexp,
  67.     MUTEX_ALLOC | MUTEX_NO_RLOCK)) != 0)
  68. goto err;
  69. /* Initialize the rest of the structure. */
  70. dblp->bufp = R_ADDR(&dblp->reginfo, lp->buffer_off);
  71. /*
  72.  * Set the handle -- we may be about to run recovery, which allocates
  73.  * log cursors.  Log cursors require logging be already configured,
  74.  * and the handle being set is what demonstrates that.
  75.  *
  76.  * If we created the region, run recovery.  If that fails, make sure
  77.  * we reset the log handle before cleaning up, otherwise we will try
  78.  * and clean up again in the mainline DB_ENV initialization code.
  79.  */
  80. dbenv->lg_handle = dblp;
  81. if (F_ISSET(&dblp->reginfo, REGION_CREATE)) {
  82. if ((ret = __log_recover(dblp)) != 0) {
  83. dbenv->lg_handle = NULL;
  84. goto err;
  85. }
  86. /*
  87.  * We first take the log file size from the environment, if
  88.  * specified.  If that wasn't set, recovery may have set it
  89.  * from the persistent information in a log file header.  If
  90.  * that didn't set it either, we default.
  91.  */
  92. if (lp->log_size == 0)
  93. lp->log_size = lp->log_nsize = LG_MAX_DEFAULT;
  94. } else {
  95. /*
  96.  * A process joining the region may have reset the log file
  97.  * size, too.  If so, it only affects the next log file we
  98.  * create.
  99.  */
  100.  if (dbenv->lg_size != 0)
  101. lp->log_nsize = dbenv->lg_size;
  102. }
  103. R_UNLOCK(dbenv, &dblp->reginfo);
  104. return (0);
  105. err: if (dblp->reginfo.addr != NULL) {
  106. if (F_ISSET(&dblp->reginfo, REGION_CREATE))
  107. ret = __db_panic(dbenv, ret);
  108. R_UNLOCK(dbenv, &dblp->reginfo);
  109. (void)__db_r_detach(dbenv, &dblp->reginfo, 0);
  110. }
  111. if (dblp->mutexp != NULL)
  112. __db_mutex_free(dbenv, &dblp->reginfo, dblp->mutexp);
  113. __os_free(dbenv, dblp);
  114. return (ret);
  115. }
  116. /*
  117.  * __log_init --
  118.  * Initialize a log region in shared memory.
  119.  */
  120. static int
  121. __log_init(dbenv, dblp)
  122. DB_ENV *dbenv;
  123. DB_LOG *dblp;
  124. {
  125. DB_MUTEX *flush_mutexp;
  126. LOG *region;
  127. int ret;
  128. void *p;
  129. #ifdef  HAVE_MUTEX_SYSTEM_RESOURCES
  130. u_int8_t *addr;
  131. #endif
  132. if ((ret = __db_shalloc(dblp->reginfo.addr,
  133.     sizeof(*region), 0, &dblp->reginfo.primary)) != 0)
  134. goto mem_err;
  135. dblp->reginfo.rp->primary =
  136.     R_OFFSET(&dblp->reginfo, dblp->reginfo.primary);
  137. region = dblp->reginfo.primary;
  138. memset(region, 0, sizeof(*region));
  139. region->fid_max = 0;
  140. SH_TAILQ_INIT(&region->fq);
  141. region->free_fid_stack = INVALID_ROFF;
  142. region->free_fids = region->free_fids_alloced = 0;
  143. /* Initialize LOG LSNs. */
  144. INIT_LSN(region->lsn);
  145. INIT_LSN(region->ready_lsn);
  146. INIT_LSN(region->t_lsn);
  147. /*
  148.  * It's possible to be waiting for an LSN of [1][0], if a replication
  149.  * client gets the first log record out of order.  An LSN of [0][0]
  150.  * signifies that we're not waiting.
  151.  */
  152. ZERO_LSN(region->waiting_lsn);
  153. /*
  154.  * Log makes note of the fact that it ran into a checkpoint on
  155.  * startup if it did so, as a recovery optimization.  A zero
  156.  * LSN signifies that it hasn't found one [yet].
  157.  */
  158. ZERO_LSN(region->cached_ckp_lsn);
  159. #ifdef  HAVE_MUTEX_SYSTEM_RESOURCES
  160. /* Allocate room for the log maintenance info and initialize it. */
  161. if ((ret = __db_shalloc(dblp->reginfo.addr,
  162.     sizeof(REGMAINT) + LG_MAINT_SIZE, 0, &addr)) != 0)
  163. goto mem_err;
  164. __db_maintinit(&dblp->reginfo, addr, LG_MAINT_SIZE);
  165. region->maint_off = R_OFFSET(&dblp->reginfo, addr);
  166. #endif
  167. if ((ret = __db_mutex_setup(dbenv, &dblp->reginfo, &region->fq_mutex,
  168.     MUTEX_NO_RLOCK)) != 0)
  169. return (ret);
  170. /*
  171.  * We must create a place for the flush mutex separately; mutexes have
  172.  * to be aligned to MUTEX_ALIGN, and the only way to guarantee that is
  173.  * to make sure they're at the beginning of a shalloc'ed chunk.
  174.  */
  175. if ((ret = __db_shalloc(dblp->reginfo.addr,
  176.     sizeof(DB_MUTEX), MUTEX_ALIGN, &flush_mutexp)) != 0)
  177. goto mem_err;
  178. if ((ret = __db_mutex_setup(dbenv, &dblp->reginfo, flush_mutexp,
  179.     MUTEX_NO_RLOCK)) != 0)
  180. return (ret);
  181. region->flush_mutex_off = R_OFFSET(&dblp->reginfo, flush_mutexp);
  182. /* Initialize the buffer. */
  183. if ((ret =
  184.     __db_shalloc(dblp->reginfo.addr, dbenv->lg_bsize, 0, &p)) != 0) {
  185. mem_err: __db_err(dbenv, "Unable to allocate memory for the log buffer");
  186. return (ret);
  187. }
  188. region->buffer_size = dbenv->lg_bsize;
  189. region->buffer_off = R_OFFSET(&dblp->reginfo, p);
  190. region->log_size = region->log_nsize = dbenv->lg_size;
  191. /* Initialize the commit Queue. */
  192. SH_TAILQ_INIT(&region->free_commits);
  193. SH_TAILQ_INIT(&region->commits);
  194. region->ncommit = 0;
  195. /*
  196.  * Fill in the log's persistent header.  Don't fill in the log file
  197.  * sizes, as they may change at any time and so have to be filled in
  198.  * as each log file is created.
  199.  */
  200. region->persist.magic = DB_LOGMAGIC;
  201. region->persist.version = DB_LOGVERSION;
  202. region->persist.mode = (u_int32_t)dbenv->db_mode;
  203. return (0);
  204. }
  205. /*
  206.  * __log_recover --
  207.  * Recover a log.
  208.  */
  209. static int
  210. __log_recover(dblp)
  211. DB_LOG *dblp;
  212. {
  213. DBT dbt;
  214. DB_ENV *dbenv;
  215. DB_LOGC *logc;
  216. DB_LSN lsn;
  217. LOG *lp;
  218. u_int32_t cnt, rectype;
  219. int ret;
  220. logfile_validity status;
  221. logc = NULL;
  222. dbenv = dblp->dbenv;
  223. lp = dblp->reginfo.primary;
  224. /*
  225.  * Find a log file.  If none exist, we simply return, leaving
  226.  * everything initialized to a new log.
  227.  */
  228. if ((ret = __log_find(dblp, 0, &cnt, &status)) != 0)
  229. return (ret);
  230. if (cnt == 0)
  231. return (0);
  232. /*
  233.  * If the last file is an old version, readable or no, start a new
  234.  * file.  Don't bother finding the end of the last log file;
  235.  * we assume that it's valid in its entirety, since the user
  236.  * should have shut down cleanly or run recovery before upgrading.
  237.  */
  238. if (status == DB_LV_OLD_READABLE || status == DB_LV_OLD_UNREADABLE) {
  239. lp->lsn.file = lp->s_lsn.file = cnt + 1;
  240. lp->lsn.offset = lp->s_lsn.offset = 0;
  241. goto skipsearch;
  242. }
  243. DB_ASSERT(status == DB_LV_NORMAL);
  244. /*
  245.  * We have the last useful log file and we've loaded any persistent
  246.  * information.  Set the end point of the log past the end of the last
  247.  * file. Read the last file, looking for the last checkpoint and
  248.  * the log's end.
  249.  */
  250. lp->lsn.file = cnt + 1;
  251. lp->lsn.offset = 0;
  252. lsn.file = cnt;
  253. lsn.offset = 0;
  254. /*
  255.  * Allocate a cursor and set it to the first record.  This shouldn't
  256.  * fail, leave error messages on.
  257.  */
  258. if ((ret = dbenv->log_cursor(dbenv, &logc, 0)) != 0)
  259. return (ret);
  260. F_SET(logc, DB_LOG_LOCKED);
  261. memset(&dbt, 0, sizeof(dbt));
  262. if ((ret = logc->get(logc, &lsn, &dbt, DB_SET)) != 0)
  263. goto err;
  264. /*
  265.  * Read to the end of the file.  This may fail at some point, so
  266.  * turn off error messages.
  267.  */
  268. F_SET(logc, DB_LOG_SILENT_ERR);
  269. while (logc->get(logc, &lsn, &dbt, DB_NEXT) == 0) {
  270. if (dbt.size < sizeof(u_int32_t))
  271. continue;
  272. memcpy(&rectype, dbt.data, sizeof(u_int32_t));
  273. if (rectype == DB___txn_ckp)
  274. /*
  275.  * If we happen to run into a checkpoint, cache its
  276.  * LSN so that the transaction system doesn't have
  277.  * to walk this log file again looking for it.
  278.  */
  279. lp->cached_ckp_lsn = lsn;
  280. }
  281. F_CLR(logc, DB_LOG_SILENT_ERR);
  282. /*
  283.  * We now know where the end of the log is.  Set the first LSN that
  284.  * we want to return to an application and the LSN of the last known
  285.  * record on disk.
  286.  */
  287. lp->lsn = lsn;
  288. lp->s_lsn = lsn;
  289. lp->lsn.offset += logc->c_len;
  290. lp->s_lsn.offset += logc->c_len;
  291. /* Set up the current buffer information, too. */
  292. lp->len = logc->c_len;
  293. lp->b_off = 0;
  294. lp->w_off = lp->lsn.offset;
  295. skipsearch:
  296. if (FLD_ISSET(dbenv->verbose, DB_VERB_RECOVERY))
  297. __db_err(dbenv,
  298.     "Finding last valid log LSN: file: %lu offset %lu",
  299.     (u_long)lp->lsn.file, (u_long)lp->lsn.offset);
  300. err: if (logc != NULL)
  301. (void)logc->close(logc, 0);
  302. return (ret);
  303. }
  304. /*
  305.  * __log_find --
  306.  * Try to find a log file.  If find_first is set, valp will contain
  307.  * the number of the first readable log file, else it will contain the number
  308.  * of the last log file (which may be too old to read).
  309.  *
  310.  * PUBLIC: int __log_find __P((DB_LOG *, int, u_int32_t *, logfile_validity *));
  311.  */
  312. int
  313. __log_find(dblp, find_first, valp, statusp)
  314. DB_LOG *dblp;
  315. int find_first;
  316. u_int32_t *valp;
  317. logfile_validity *statusp;
  318. {
  319. DB_ENV *dbenv;
  320. logfile_validity logval_status, status;
  321. u_int32_t clv, logval;
  322. int cnt, fcnt, ret;
  323. const char *dir;
  324. char *c, **names, *p, *q, savech;
  325. dbenv = dblp->dbenv;
  326. logval_status = status = DB_LV_NONEXISTENT;
  327. /* Return a value of 0 as the log file number on failure. */
  328. *valp = 0;
  329. /* Find the directory name. */
  330. if ((ret = __log_name(dblp, 1, &p, NULL, 0)) != 0)
  331. return (ret);
  332. if ((q = __db_rpath(p)) == NULL) {
  333. COMPQUIET(savech, 0);
  334. dir = PATH_DOT;
  335. } else {
  336. savech = *q;
  337. *q = '';
  338. dir = p;
  339. }
  340. /* Get the list of file names. */
  341. ret = __os_dirlist(dbenv, dir, &names, &fcnt);
  342. /*
  343.  * !!!
  344.  * We overwrote a byte in the string with a nul.  Restore the string
  345.  * so that the diagnostic checks in the memory allocation code work
  346.  * and any error messages display the right file name.
  347.  */
  348. if (q != NULL)
  349. *q = savech;
  350. if (ret != 0) {
  351. __db_err(dbenv, "%s: %s", dir, db_strerror(ret));
  352. __os_free(dbenv, p);
  353. return (ret);
  354. }
  355. /* Search for a valid log file name. */
  356. for (cnt = fcnt, clv = logval = 0; --cnt >= 0;) {
  357. if (strncmp(names[cnt], LFPREFIX, sizeof(LFPREFIX) - 1) != 0)
  358. continue;
  359. /*
  360.  * Names of the form log.[0-9]* are reserved for DB.  Other
  361.  * names sharing LFPREFIX, such as "log.db", are legal.
  362.  */
  363. for (c = names[cnt] + sizeof(LFPREFIX) - 1; *c != ''; c++)
  364. if (!isdigit((int)*c))
  365. break;
  366. if (*c != '')
  367. continue;
  368. /*
  369.  * Use atol, not atoi; if an "int" is 16-bits, the largest
  370.  * log file name won't fit.
  371.  */
  372. clv = atol(names[cnt] + (sizeof(LFPREFIX) - 1));
  373. /*
  374.  * If searching for the first log file, we want to return the
  375.  * oldest log file we can read, or, if no readable log files
  376.  * exist, the newest log file we can't read (the crossover
  377.  * point between the old and new versions of the log file).
  378.  *
  379.  * If we're searching for the last log file, we want to return
  380.  * the newest log file, period.
  381.  *
  382.  * Readable log files should never preceede unreadable log
  383.  * files, that would mean the admin seriously screwed up.
  384.  */
  385. if (find_first) {
  386. if (logval != 0 &&
  387.     status != DB_LV_OLD_UNREADABLE && clv > logval)
  388. continue;
  389. } else
  390. if (logval != 0 && clv < logval)
  391. continue;
  392. if ((ret = __log_valid(dblp, clv, 1, &status)) != 0) {
  393. __db_err(dbenv, "Invalid log file: %s: %s",
  394.     names[cnt], db_strerror(ret));
  395. goto err;
  396. }
  397. switch (status) {
  398. case DB_LV_NONEXISTENT:
  399. /* __log_valid never returns DB_LV_NONEXISTENT. */
  400. DB_ASSERT(0);
  401. break;
  402. case DB_LV_INCOMPLETE:
  403. /*
  404.  * The last log file may not have been initialized --
  405.  * it's possible to create a log file but not write
  406.  * anything to it.  If performing recovery (that is,
  407.  * if find_first isn't set), ignore the file, it's
  408.  * not interesting.  If we're searching for the first
  409.  * log record, return the file (assuming we don't find
  410.  * something better), as the "real" first log record
  411.  * is likely to be in the log buffer, and we want to
  412.  * set the file LSN for our return.
  413.  */
  414. if (find_first)
  415. goto found;
  416. break;
  417. case DB_LV_OLD_UNREADABLE:
  418. /*
  419.  * If we're searching for the first log file, then we
  420.  * only want this file if we don't yet have a file or
  421.  * already have an unreadable file and this one is
  422.  * newer than that one.  If we're searching for the
  423.  * last log file, we always want this file because we
  424.  * wouldn't be here if it wasn't newer than our current
  425.  * choice.
  426.  */
  427. if (!find_first || logval == 0 ||
  428.     (status == DB_LV_OLD_UNREADABLE && clv > logval))
  429. goto found;
  430. break;
  431. case DB_LV_NORMAL:
  432. case DB_LV_OLD_READABLE:
  433. found: logval = clv;
  434. logval_status = status;
  435. break;
  436. }
  437. }
  438. *valp = logval;
  439. err: __os_dirfree(dbenv, names, fcnt);
  440. __os_free(dbenv, p);
  441. *statusp = logval_status;
  442. return (ret);
  443. }
  444. /*
  445.  * log_valid --
  446.  * Validate a log file.  Returns an error code in the event of
  447.  * a fatal flaw in a the specified log file;  returns success with
  448.  * a code indicating the currentness and completeness of the specified
  449.  * log file if it is not unexpectedly flawed (that is, if it's perfectly
  450.  * normal, if it's zero-length, or if it's an old version).
  451.  *
  452.  * PUBLIC: int __log_valid __P((DB_LOG *, u_int32_t, int, logfile_validity *));
  453.  */
  454. int
  455. __log_valid(dblp, number, set_persist, statusp)
  456. DB_LOG *dblp;
  457. u_int32_t number;
  458. int set_persist;
  459. logfile_validity *statusp;
  460. {
  461. DB_CIPHER *db_cipher;
  462. DB_ENV *dbenv;
  463. DB_FH fh;
  464. HDR *hdr;
  465. LOG *region;
  466. LOGP *persist;
  467. logfile_validity status;
  468. size_t hdrsize, nw, recsize;
  469. int is_hmac, need_free, ret;
  470. u_int8_t *tmp;
  471. char *fname;
  472. dbenv = dblp->dbenv;
  473. db_cipher = dbenv->crypto_handle;
  474. persist = NULL;
  475. status = DB_LV_NORMAL;
  476. /* Try to open the log file. */
  477. if ((ret = __log_name(dblp,
  478.     number, &fname, &fh, DB_OSO_RDONLY | DB_OSO_SEQ)) != 0) {
  479. __os_free(dbenv, fname);
  480. return (ret);
  481. }
  482. need_free = 0;
  483. hdrsize = HDR_NORMAL_SZ;
  484. is_hmac = 0;
  485. recsize = sizeof(LOGP);
  486. if (CRYPTO_ON(dbenv)) {
  487. hdrsize = HDR_CRYPTO_SZ;
  488. recsize = sizeof(LOGP);
  489. recsize += db_cipher->adj_size(recsize);
  490. is_hmac = 1;
  491. }
  492. if ((ret = __os_calloc(dbenv, 1, recsize + hdrsize, &tmp)) != 0)
  493. return (ret);
  494. need_free = 1;
  495. hdr = (HDR *)tmp;
  496. persist = (LOGP *)(tmp + hdrsize);
  497. /* Try to read the header. */
  498. if ((ret = __os_read(dbenv, &fh, tmp, recsize + hdrsize, &nw)) != 0 ||
  499.     nw != recsize + hdrsize) {
  500. if (ret == 0)
  501. status = DB_LV_INCOMPLETE;
  502. else
  503. /*
  504.  * The error was a fatal read error, not just an
  505.  * incompletely initialized log file.
  506.  */
  507. __db_err(dbenv, "Ignoring log file: %s: %s",
  508.     fname, db_strerror(ret));
  509. (void)__os_closehandle(dbenv, &fh);
  510. goto err;
  511. }
  512. (void)__os_closehandle(dbenv, &fh);
  513. /*
  514.  * Now we have to validate the persistent record.  We have
  515.  * several scenarios we have to deal with:
  516.  *
  517.  * 1.  User has crypto turned on:
  518.  * - They're reading an old, unencrypted log file
  519.  *   .  We will fail the record size match check below.
  520.  * - They're reading a current, unencrypted log file
  521.  *   .  We will fail the record size match check below.
  522.  * - They're reading an old, encrypted log file [NOT YET]
  523.  *   .  After decryption we'll fail the version check.  [NOT YET]
  524.  * - They're reading a current, encrypted log file
  525.  *   .  We should proceed as usual.
  526.  * 2.  User has crypto turned off:
  527.  * - They're reading an old, unencrypted log file
  528.  *   .  We will fail the version check.
  529.  * - They're reading a current, unencrypted log file
  530.  *   .  We should proceed as usual.
  531.  * - They're reading an old, encrypted log file [NOT YET]
  532.  *   .  We'll fail the magic number check (it is encrypted).
  533.  * - They're reading a current, encrypted log file
  534.  *   .  We'll fail the magic number check (it is encrypted).
  535.  */
  536. if (CRYPTO_ON(dbenv)) {
  537. /*
  538.  * If we are trying to decrypt an unencrypted log
  539.  * we can only detect that by having an unreasonable
  540.  * data length for our persistent data.
  541.  */
  542. if ((hdr->len - hdrsize) != sizeof(LOGP)) {
  543. __db_err(dbenv, "log record size mismatch");
  544. goto err;
  545. }
  546. /* Check the checksum and decrypt. */
  547. if ((ret = __db_check_chksum(dbenv, db_cipher, &hdr->chksum[0],
  548.     (u_int8_t *)persist, hdr->len - hdrsize, is_hmac)) != 0) {
  549. __db_err(dbenv, "log record checksum mismatch");
  550. goto err;
  551. }
  552. if ((ret = db_cipher->decrypt(dbenv, db_cipher->data,
  553.     &hdr->iv[0], (u_int8_t *)persist, hdr->len - hdrsize)) != 0)
  554. goto err;
  555. }
  556. /* Validate the header. */
  557. if (persist->magic != DB_LOGMAGIC) {
  558. __db_err(dbenv,
  559.     "Ignoring log file: %s: magic number %lx, not %lx",
  560.     fname, (u_long)persist->magic, (u_long)DB_LOGMAGIC);
  561. ret = EINVAL;
  562. goto err;
  563. }
  564. /*
  565.  * Set our status code to indicate whether the log file
  566.  * belongs to an unreadable or readable old version;  leave it
  567.  * alone if and only if the log file version is the current one.
  568.  */
  569. if (persist->version > DB_LOGVERSION) {
  570. /* This is a fatal error--the log file is newer than DB. */
  571. __db_err(dbenv,
  572.     "Ignoring log file: %s: unsupported log version %lu",
  573.     fname, (u_long)persist->version);
  574. ret = EINVAL;
  575. goto err;
  576. } else if (persist->version < DB_LOGOLDVER) {
  577. status = DB_LV_OLD_UNREADABLE;
  578. /*
  579.  * We don't want to set persistent info based on an
  580.  * unreadable region, so jump to "err".
  581.  */
  582. goto err;
  583. } else if (persist->version < DB_LOGVERSION)
  584. status = DB_LV_OLD_READABLE;
  585. /*
  586.  * Only if we have a current log do we verify the checksum.
  587.  * We could not check the checksum before checking the magic
  588.  * and version because old log hdrs have the length and checksum
  589.  * in a different location.
  590.  */
  591. if (!CRYPTO_ON(dbenv) && ((ret = __db_check_chksum(dbenv,
  592.     db_cipher, &hdr->chksum[0], (u_int8_t *)persist,
  593.     hdr->len - hdrsize, is_hmac)) != 0)) {
  594. __db_err(dbenv, "log record checksum mismatch");
  595. goto err;
  596. }
  597. /*
  598.  * If the log is readable so far and we're doing system initialization,
  599.  * set the region's persistent information based on the headers.
  600.  *
  601.  * Always set the current log file size.  Only set the next log file's
  602.  * size if the application hasn't set it already.
  603.  *
  604.  * XXX
  605.  * Always use the persistent header's mode, regardless of what was set
  606.  * in the current environment.  We've always done it this way, but it's
  607.  * probably a bug -- I can't think of a way not-changing the mode would
  608.  * be a problem, though.
  609.  */
  610. if (set_persist) {
  611. region = dblp->reginfo.primary;
  612. region->log_size = persist->log_size;
  613. if (region->log_nsize == 0)
  614. region->log_nsize = persist->log_size;
  615. region->persist.mode = persist->mode;
  616. }
  617. err: __os_free(dbenv, fname);
  618. if (need_free)
  619. __os_free(dbenv, tmp);
  620. *statusp = status;
  621. return (ret);
  622. }
  623. /*
  624.  * __log_dbenv_refresh --
  625.  * Clean up after the log system on a close or failed open.  Called only
  626.  * from __dbenv_refresh.  (Formerly called __log_close.)
  627.  *
  628.  * PUBLIC: int __log_dbenv_refresh __P((DB_ENV *));
  629.  */
  630. int
  631. __log_dbenv_refresh(dbenv)
  632. DB_ENV *dbenv;
  633. {
  634. DB_LOG *dblp;
  635. int ret, t_ret;
  636. dblp = dbenv->lg_handle;
  637. /* We may have opened files as part of XA; if so, close them. */
  638. F_SET(dblp, DBLOG_RECOVER);
  639. ret = __dbreg_close_files(dbenv);
  640. /* Discard the per-thread lock. */
  641. if (dblp->mutexp != NULL)
  642. __db_mutex_free(dbenv, &dblp->reginfo, dblp->mutexp);
  643. /* Detach from the region. */
  644. if ((t_ret =
  645.     __db_r_detach(dbenv, &dblp->reginfo, 0)) != 0 && ret == 0)
  646. ret = t_ret;
  647. /* Close open files, release allocated memory. */
  648. if (F_ISSET(&dblp->lfh, DB_FH_VALID) &&
  649.     (t_ret = __os_closehandle(dbenv, &dblp->lfh)) != 0 && ret == 0)
  650. ret = t_ret;
  651. if (dblp->dbentry != NULL)
  652. __os_free(dbenv, dblp->dbentry);
  653. __os_free(dbenv, dblp);
  654. dbenv->lg_handle = NULL;
  655. return (ret);
  656. }
  657. /*
  658.  * __log_stat --
  659.  * Return log statistics.
  660.  *
  661.  * PUBLIC: int __log_stat __P((DB_ENV *, DB_LOG_STAT **, u_int32_t));
  662.  */
  663. int
  664. __log_stat(dbenv, statp, flags)
  665. DB_ENV *dbenv;
  666. DB_LOG_STAT **statp;
  667. u_int32_t flags;
  668. {
  669. DB_LOG *dblp;
  670. DB_LOG_STAT *stats;
  671. LOG *region;
  672. int ret;
  673. PANIC_CHECK(dbenv);
  674. ENV_REQUIRES_CONFIG(dbenv,
  675.     dbenv->lg_handle, "DB_ENV->log_stat", DB_INIT_LOG);
  676. *statp = NULL;
  677. if ((ret = __db_fchk(dbenv,
  678.     "DB_ENV->log_stat", flags, DB_STAT_CLEAR)) != 0)
  679. return (ret);
  680. dblp = dbenv->lg_handle;
  681. region = dblp->reginfo.primary;
  682. if ((ret = __os_umalloc(dbenv, sizeof(DB_LOG_STAT), &stats)) != 0)
  683. return (ret);
  684. /* Copy out the global statistics. */
  685. R_LOCK(dbenv, &dblp->reginfo);
  686. *stats = region->stat;
  687. if (LF_ISSET(DB_STAT_CLEAR))
  688. memset(&region->stat, 0, sizeof(region->stat));
  689. stats->st_magic = region->persist.magic;
  690. stats->st_version = region->persist.version;
  691. stats->st_mode = region->persist.mode;
  692. stats->st_lg_bsize = region->buffer_size;
  693. stats->st_lg_size = region->log_nsize;
  694. stats->st_region_wait = dblp->reginfo.rp->mutex.mutex_set_wait;
  695. stats->st_region_nowait = dblp->reginfo.rp->mutex.mutex_set_nowait;
  696. if (LF_ISSET(DB_STAT_CLEAR)) {
  697. dblp->reginfo.rp->mutex.mutex_set_wait = 0;
  698. dblp->reginfo.rp->mutex.mutex_set_nowait = 0;
  699. }
  700. stats->st_regsize = dblp->reginfo.rp->size;
  701. stats->st_cur_file = region->lsn.file;
  702. stats->st_cur_offset = region->lsn.offset;
  703. stats->st_disk_file = region->s_lsn.file;
  704. stats->st_disk_offset = region->s_lsn.offset;
  705. R_UNLOCK(dbenv, &dblp->reginfo);
  706. *statp = stats;
  707. return (0);
  708. }
  709. /*
  710.  * __log_get_cached_ckp_lsn --
  711.  * Retrieve any last checkpoint LSN that we may have found on startup.
  712.  *
  713.  * PUBLIC: void __log_get_cached_ckp_lsn __P((DB_ENV *, DB_LSN *));
  714.  */
  715. void
  716. __log_get_cached_ckp_lsn(dbenv, ckp_lsnp)
  717. DB_ENV *dbenv;
  718. DB_LSN *ckp_lsnp;
  719. {
  720. DB_LOG *dblp;
  721. LOG *lp;
  722. dblp = (DB_LOG *)dbenv->lg_handle;
  723. lp = (LOG *)dblp->reginfo.primary;
  724. R_LOCK(dbenv, &dblp->reginfo);
  725. *ckp_lsnp = lp->cached_ckp_lsn;
  726. R_UNLOCK(dbenv, &dblp->reginfo);
  727. }
  728. /*
  729.  * __log_region_size --
  730.  * Return the amount of space needed for the log region.
  731.  * Make the region large enough to hold txn_max transaction
  732.  * detail structures  plus some space to hold thread handles
  733.  * and the beginning of the shalloc region and anything we
  734.  * need for mutex system resource recording.
  735.  */
  736. static size_t
  737. __log_region_size(dbenv)
  738. DB_ENV *dbenv;
  739. {
  740. size_t s;
  741. s = dbenv->lg_regionmax + dbenv->lg_bsize;
  742. #ifdef HAVE_MUTEX_SYSTEM_RESOURCES
  743. if (F_ISSET(dbenv, DB_ENV_THREAD))
  744. s += sizeof(REGMAINT) + LG_MAINT_SIZE;
  745. #endif
  746. return (s);
  747. }
  748. /*
  749.  * __log_region_destroy
  750.  * Destroy any region maintenance info.
  751.  *
  752.  * PUBLIC: void __log_region_destroy __P((DB_ENV *, REGINFO *));
  753.  */
  754. void
  755. __log_region_destroy(dbenv, infop)
  756. DB_ENV *dbenv;
  757. REGINFO *infop;
  758. {
  759. __db_shlocks_destroy(infop, (REGMAINT *)R_ADDR(infop,
  760.     ((LOG *)R_ADDR(infop, infop->rp->primary))->maint_off));
  761. COMPQUIET(dbenv, NULL);
  762. COMPQUIET(infop, NULL);
  763. }
  764. /*
  765.  * __log_vtruncate
  766.  * This is a virtual truncate.  We set up the log indicators to
  767.  * make everyone believe that the given record is the last one in the
  768.  * log.  Returns with the next valid LSN (i.e., the LSN of the next
  769.  * record to be written). This is used in replication to discard records
  770.  * in the log file that do not agree with the master.
  771.  *
  772.  * PUBLIC: int __log_vtruncate __P((DB_ENV *, DB_LSN *, DB_LSN *));
  773.  */
  774. int
  775. __log_vtruncate(dbenv, lsn, ckplsn)
  776. DB_ENV *dbenv;
  777. DB_LSN *lsn, *ckplsn;
  778. {
  779. DBT log_dbt;
  780. DB_FH fh;
  781. DB_LOG *dblp;
  782. DB_LOGC *logc;
  783. DB_LSN end_lsn;
  784. LOG *lp;
  785. u_int32_t bytes, c_len;
  786. int fn, ret, t_ret;
  787. char *fname;
  788. /* Need to find out the length of this soon-to-be-last record. */
  789. if ((ret = dbenv->log_cursor(dbenv, &logc, 0)) != 0)
  790. return (ret);
  791. memset(&log_dbt, 0, sizeof(log_dbt));
  792. ret = logc->get(logc, lsn, &log_dbt, DB_SET);
  793. c_len = logc->c_len;
  794. if ((t_ret = logc->close(logc, 0)) != 0 && ret == 0)
  795. ret = t_ret;
  796. if (ret != 0)
  797. return (ret);
  798. /* Now do the truncate. */
  799. dblp = (DB_LOG *)dbenv->lg_handle;
  800. lp = (LOG *)dblp->reginfo.primary;
  801. R_LOCK(dbenv, &dblp->reginfo);
  802. end_lsn = lp->lsn;
  803. lp->lsn = *lsn;
  804. lp->len = c_len;
  805. lp->lsn.offset += lp->len;
  806. /*
  807.  * I am going to assume that the number of bytes written since
  808.  * the last checkpoint doesn't exceed a 32-bit number.
  809.  */
  810. DB_ASSERT(lp->lsn.file >= ckplsn->file);
  811. bytes = 0;
  812. if (ckplsn->file != lp->lsn.file) {
  813. bytes = lp->log_size - ckplsn->offset;
  814. if (lp->lsn.file > ckplsn->file + 1)
  815. bytes += lp->log_size *
  816.     (lp->lsn.file - ckplsn->file - 1);
  817. bytes += lp->lsn.offset;
  818. } else
  819. bytes = lp->lsn.offset - ckplsn->offset;
  820. lp->stat.st_wc_mbytes += bytes / MEGABYTE;
  821. lp->stat.st_wc_bytes += bytes % MEGABYTE;
  822. /*
  823.  * If the saved lsn is greater than our new end of log, reset it
  824.  * to our current end of log.
  825.  */
  826. if (log_compare(&lp->s_lsn, lsn) > 0)
  827. lp->s_lsn = lp->lsn;
  828. /*
  829.  * If the new end of log is in the middle of the buffer,
  830.  * don't change the w_off or f_lsn.  If the new end is
  831.  * before the w_off then reset w_off and f_lsn to the new
  832.  * end of log.
  833.  */
  834. if (lp->w_off >= lp->lsn.offset) {
  835. lp->f_lsn = lp->lsn;
  836. lp->w_off = lp->lsn.offset;
  837. lp->b_off = 0;
  838. } else
  839. lp->b_off = lp->lsn.offset - lp->w_off;
  840. ZERO_LSN(lp->waiting_lsn);
  841. lp->ready_lsn = lp->lsn;
  842. lp->wait_recs = 0;
  843. lp->rcvd_recs = 0;
  844. /* Now throw away any extra log files that we have around. */
  845. for (fn = lp->lsn.file + 1;; fn++) {
  846. if (__log_name(dblp, fn, &fname, &fh, DB_OSO_RDONLY) != 0) {
  847. __os_free(dbenv, fname);
  848. break;
  849. }
  850. (void)__os_closehandle(dbenv, &fh);
  851. ret = __os_unlink(dbenv, fname);
  852. __os_free(dbenv, fname);
  853. if (ret != 0)
  854. goto err;
  855. }
  856. /* Truncate the log to the new point. */
  857. if ((ret = __log_zero(dbenv, &lp->lsn, &end_lsn)) != 0)
  858. goto err;
  859. err: R_UNLOCK(dbenv, &dblp->reginfo);
  860. return (ret);
  861. }
  862. /*
  863.  * __log_is_outdated --
  864.  * Used by the replication system to identify if a client's logs
  865.  * are too old.  The log represented by dbenv is compared to the file
  866.  * number passed in fnum.  If the log file fnum does not exist and is
  867.  * lower-numbered than the current logs, the we return *outdatedp non
  868.  * zero, else we return it 0.
  869.  *
  870.  * PUBLIC: int __log_is_outdated __P((DB_ENV *dbenv,
  871.  * PUBLIC:     u_int32_t fnum, int *outdatedp));
  872.  */
  873. int
  874. __log_is_outdated(dbenv, fnum, outdatedp)
  875. DB_ENV *dbenv;
  876. u_int32_t fnum;
  877. int *outdatedp;
  878. {
  879. DB_LOG *dblp;
  880. LOG *lp;
  881. char *name;
  882. int ret;
  883. u_int32_t cfile;
  884. dblp = dbenv->lg_handle;
  885. *outdatedp = 0;
  886. if ((ret = __log_name(dblp, fnum, &name, NULL, 0)) != 0)
  887. return (ret);
  888. /* If the file exists, we're just fine. */
  889. if (__os_exists(name, NULL) == 0)
  890. goto out;
  891. /*
  892.  * It didn't exist, decide if the file number is too big or
  893.  * too little.  If it's too little, then we need to indicate
  894.  * that the LSN is outdated.
  895.  */
  896. R_LOCK(dbenv, &dblp->reginfo);
  897. lp = (LOG *)dblp->reginfo.primary;
  898. cfile = lp->lsn.file;
  899. R_UNLOCK(dbenv, &dblp->reginfo);
  900. if (cfile > fnum)
  901. *outdatedp = 1;
  902. out: __os_free(dbenv, name);
  903. return (ret);
  904. }
  905. /*
  906.  * __log_zero --
  907.  * Zero out the tail of a log after a truncate.
  908.  */
  909. static int
  910. __log_zero(dbenv, from_lsn, to_lsn)
  911. DB_ENV *dbenv;
  912. DB_LSN *from_lsn, *to_lsn;
  913. {
  914. char *lname;
  915. DB_LOG *dblp;
  916. LOG *lp;
  917. int ret;
  918. size_t nbytes, len, nw;
  919. u_int8_t buf[4096];
  920. u_int32_t mbytes, bytes;
  921. dblp = dbenv->lg_handle;
  922. lp = (LOG *)dblp->reginfo.primary;
  923. lname = NULL;
  924. if (dblp->lfname != lp->lsn.file) {
  925. if (F_ISSET(&dblp->lfh, DB_FH_VALID))
  926. (void)__os_closehandle(dbenv, &dblp->lfh);
  927. dblp->lfname = lp->lsn.file;
  928. }
  929. if (from_lsn->file != to_lsn->file) {
  930. /* We removed some log files; have to 0 to end of file. */
  931. if (!F_ISSET(&dblp->lfh, DB_FH_VALID) && (ret =
  932.     __log_name(dblp, dblp->lfname, &lname, &dblp->lfh, 0)) != 0)
  933. return (ret);
  934. if ((ret = __os_ioinfo(dbenv,
  935.     NULL, &dblp->lfh, &mbytes, &bytes, NULL)) != 0)
  936. goto err;
  937. len = mbytes * MEGABYTE + bytes - from_lsn->offset;
  938. } else if (to_lsn->offset <= from_lsn->offset)
  939. return (0);
  940. else
  941. len = to_lsn->offset = from_lsn->offset;
  942. memset(buf, 0, sizeof(buf));
  943. /* Initialize the write position. */
  944. if (!F_ISSET(&dblp->lfh, DB_FH_VALID) &&
  945.     (ret = __log_name(dblp, dblp->lfname, &lname, &dblp->lfh, 0)) != 0)
  946. goto err;
  947. if ((ret = __os_seek(dbenv,
  948.     &dblp->lfh, 0, 0, from_lsn->offset, 0, DB_OS_SEEK_SET)) != 0)
  949. return (ret);
  950. while (len > 0) {
  951. nbytes = len > sizeof(buf) ? sizeof(buf) : len;
  952. if ((ret =
  953.     __os_write(dbenv, &dblp->lfh, buf, nbytes, &nw)) != 0)
  954. return (ret);
  955. len -= nbytes;
  956. }
  957. err: if (lname != NULL)
  958. __os_free(dbenv, lname);
  959. return (0);
  960. }