trx0purge.c
上传用户:romrleung
上传日期:2022-05-23
资源大小:18897k
文件大小:28k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /******************************************************
  2. Purge old versions
  3. (c) 1996 Innobase Oy
  4. Created 3/26/1996 Heikki Tuuri
  5. *******************************************************/
  6. #include "trx0purge.h"
  7. #ifdef UNIV_NONINL
  8. #include "trx0purge.ic"
  9. #endif
  10. #include "fsp0fsp.h"
  11. #include "mach0data.h"
  12. #include "trx0rseg.h"
  13. #include "trx0trx.h"
  14. #include "trx0roll.h"
  15. #include "read0read.h"
  16. #include "fut0fut.h"
  17. #include "que0que.h"
  18. #include "row0purge.h"
  19. #include "row0upd.h"
  20. #include "trx0rec.h"
  21. #include "srv0que.h"
  22. #include "os0thread.h"
  23. /* The global data structure coordinating a purge */
  24. trx_purge_t* purge_sys = NULL;
  25. /* A dummy undo record used as a return value when we have a whole undo log
  26. which needs no purge */
  27. trx_undo_rec_t trx_purge_dummy_rec;
  28. /*********************************************************************
  29. Checks if trx_id is >= purge_view: then it is guaranteed that its update
  30. undo log still exists in the system. */
  31. ibool
  32. trx_purge_update_undo_must_exist(
  33. /*=============================*/
  34. /* out: TRUE if is sure that it is preserved, also
  35. if the function returns FALSE, it is possible that
  36. the undo log still exists in the system */
  37. dulint trx_id) /* in: transaction id */
  38. {
  39. #ifdef UNIV_SYNC_DEBUG
  40. ut_ad(rw_lock_own(&(purge_sys->latch), RW_LOCK_SHARED));
  41. #endif /* UNIV_SYNC_DEBUG */
  42. if (!read_view_sees_trx_id(purge_sys->view, trx_id)) {
  43. return(TRUE);
  44. }
  45. return(FALSE);
  46. }
  47. /*=================== PURGE RECORD ARRAY =============================*/
  48. /***********************************************************************
  49. Stores info of an undo log record during a purge. */
  50. static
  51. trx_undo_inf_t*
  52. trx_purge_arr_store_info(
  53. /*=====================*/
  54. /* out: pointer to the storage cell */
  55. dulint trx_no, /* in: transaction number */
  56. dulint undo_no)/* in: undo number */
  57. {
  58. trx_undo_inf_t* cell;
  59. trx_undo_arr_t* arr;
  60. ulint i;
  61. arr = purge_sys->arr;
  62. for (i = 0;; i++) {
  63. cell = trx_undo_arr_get_nth_info(arr, i);
  64. if (!(cell->in_use)) {
  65. /* Not in use, we may store here */
  66. cell->undo_no = undo_no;
  67. cell->trx_no = trx_no;
  68. cell->in_use = TRUE;
  69. arr->n_used++;
  70. return(cell);
  71. }
  72. }
  73. }
  74. /***********************************************************************
  75. Removes info of an undo log record during a purge. */
  76. UNIV_INLINE
  77. void
  78. trx_purge_arr_remove_info(
  79. /*======================*/
  80. trx_undo_inf_t* cell) /* in: pointer to the storage cell */
  81. {
  82. trx_undo_arr_t* arr;
  83. arr = purge_sys->arr;
  84. cell->in_use = FALSE;
  85. ut_ad(arr->n_used > 0);
  86. arr->n_used--;
  87. }
  88. /***********************************************************************
  89. Gets the biggest pair of a trx number and an undo number in a purge array. */
  90. static
  91. void
  92. trx_purge_arr_get_biggest(
  93. /*======================*/
  94. trx_undo_arr_t* arr, /* in: purge array */
  95. dulint* trx_no, /* out: transaction number: ut_dulint_zero
  96. if array is empty */
  97. dulint* undo_no)/* out: undo number */
  98. {
  99. trx_undo_inf_t* cell;
  100. dulint pair_trx_no;
  101. dulint pair_undo_no;
  102. int trx_cmp;
  103. ulint n_used;
  104. ulint i;
  105. ulint n;
  106. n = 0;
  107. n_used = arr->n_used;
  108. pair_trx_no = ut_dulint_zero;
  109. pair_undo_no = ut_dulint_zero;
  110. for (i = 0;; i++) {
  111. cell = trx_undo_arr_get_nth_info(arr, i);
  112. if (cell->in_use) {
  113. n++;
  114.   trx_cmp = ut_dulint_cmp(cell->trx_no, pair_trx_no);
  115. if ((trx_cmp > 0)
  116.     || ((trx_cmp == 0)
  117.         && (ut_dulint_cmp(cell->undo_no,
  118. pair_undo_no) >= 0))) {
  119. pair_trx_no = cell->trx_no;
  120. pair_undo_no = cell->undo_no;
  121. }
  122. }
  123. if (n == n_used) {
  124. *trx_no = pair_trx_no;
  125. *undo_no = pair_undo_no;
  126. return;
  127. }
  128. }
  129. }
  130. /********************************************************************
  131. Builds a purge 'query' graph. The actual purge is performed by executing
  132. this query graph. */
  133. static
  134. que_t*
  135. trx_purge_graph_build(void)
  136. /*=======================*/
  137. /* out, own: the query graph */
  138. {
  139. mem_heap_t* heap;
  140. que_fork_t* fork;
  141. que_thr_t* thr;
  142. /* que_thr_t* thr2; */
  143. heap = mem_heap_create(512);
  144. fork = que_fork_create(NULL, NULL, QUE_FORK_PURGE, heap);
  145. fork->trx = purge_sys->trx;
  146. thr = que_thr_create(fork, heap);
  147. thr->child = row_purge_node_create(thr, heap);  
  148. /* thr2 = que_thr_create(fork, fork, heap);
  149. thr2->child = row_purge_node_create(fork, thr2, heap);   */
  150. return(fork);
  151. }
  152. /************************************************************************
  153. Creates the global purge system control structure and inits the history
  154. mutex. */
  155. void
  156. trx_purge_sys_create(void)
  157. /*======================*/
  158. {
  159. #ifdef UNIV_SYNC_DEBUG
  160. ut_ad(mutex_own(&kernel_mutex));
  161. #endif /* UNIV_SYNC_DEBUG */
  162. purge_sys = mem_alloc(sizeof(trx_purge_t));
  163. purge_sys->state = TRX_STOP_PURGE;
  164. purge_sys->n_pages_handled = 0;
  165. purge_sys->purge_trx_no = ut_dulint_zero;
  166. purge_sys->purge_undo_no = ut_dulint_zero;
  167. purge_sys->next_stored = FALSE;
  168. rw_lock_create(&(purge_sys->latch));
  169. rw_lock_set_level(&(purge_sys->latch), SYNC_PURGE_LATCH);
  170. mutex_create(&(purge_sys->mutex));
  171. mutex_set_level(&(purge_sys->mutex), SYNC_PURGE_SYS);
  172. purge_sys->heap = mem_heap_create(256);
  173. purge_sys->arr = trx_undo_arr_create();
  174. purge_sys->sess = sess_open();
  175. purge_sys->trx = purge_sys->sess->trx;
  176. purge_sys->trx->type = TRX_PURGE;
  177. ut_a(trx_start_low(purge_sys->trx, ULINT_UNDEFINED));
  178. purge_sys->query = trx_purge_graph_build();
  179. purge_sys->view = read_view_oldest_copy_or_open_new(NULL,
  180. purge_sys->heap);
  181. }
  182. /*================ UNDO LOG HISTORY LIST =============================*/
  183. /************************************************************************
  184. Adds the update undo log as the first log in the history list. Removes the
  185. update undo log segment from the rseg slot if it is too big for reuse. */
  186. void
  187. trx_purge_add_update_undo_to_history(
  188. /*=================================*/
  189. trx_t* trx, /* in: transaction */
  190. page_t* undo_page, /* in: update undo log header page,
  191. x-latched */
  192. mtr_t* mtr) /* in: mtr */
  193. {
  194. trx_undo_t* undo;
  195. trx_rseg_t* rseg;
  196. trx_rsegf_t* rseg_header;
  197. trx_usegf_t* seg_header;
  198. trx_ulogf_t* undo_header;
  199. trx_upagef_t* page_header;
  200. ulint hist_size;
  201. undo = trx->update_undo;
  202. ut_ad(undo);
  203. rseg = undo->rseg;
  204. #ifdef UNIV_SYNC_DEBUG
  205. ut_ad(mutex_own(&(rseg->mutex)));
  206. #endif /* UNIV_SYNC_DEBUG */
  207. rseg_header = trx_rsegf_get(rseg->space, rseg->page_no, mtr);
  208. undo_header = undo_page + undo->hdr_offset;
  209. seg_header  = undo_page + TRX_UNDO_SEG_HDR;
  210. page_header = undo_page + TRX_UNDO_PAGE_HDR;
  211. if (undo->state != TRX_UNDO_CACHED) {
  212. /* The undo log segment will not be reused */
  213. if (undo->id >= TRX_RSEG_N_SLOTS) {
  214. fprintf(stderr,
  215. "InnoDB: Error: undo->id is %lun", (ulong) undo->id);
  216. ut_error;
  217. }
  218. trx_rsegf_set_nth_undo(rseg_header, undo->id, FIL_NULL, mtr);
  219. hist_size = mtr_read_ulint(rseg_header + TRX_RSEG_HISTORY_SIZE,
  220. MLOG_4BYTES, mtr);
  221. ut_ad(undo->size ==
  222. flst_get_len(seg_header + TRX_UNDO_PAGE_LIST, mtr));
  223. mlog_write_ulint(rseg_header + TRX_RSEG_HISTORY_SIZE,
  224. hist_size + undo->size, MLOG_4BYTES, mtr);
  225. }
  226. /* Add the log as the first in the history list */
  227. flst_add_first(rseg_header + TRX_RSEG_HISTORY,
  228. undo_header + TRX_UNDO_HISTORY_NODE, mtr);
  229. mutex_enter(&kernel_mutex);
  230. trx_sys->rseg_history_len++;
  231. mutex_exit(&kernel_mutex);
  232. /* Write the trx number to the undo log header */
  233. mlog_write_dulint(undo_header + TRX_UNDO_TRX_NO, trx->no, mtr);
  234. /* Write information about delete markings to the undo log header */
  235. if (!undo->del_marks) {
  236. mlog_write_ulint(undo_header + TRX_UNDO_DEL_MARKS, FALSE,
  237. MLOG_2BYTES, mtr);
  238. }
  239. if (rseg->last_page_no == FIL_NULL) {
  240. rseg->last_page_no = undo->hdr_page_no;
  241. rseg->last_offset = undo->hdr_offset;
  242. rseg->last_trx_no = trx->no;
  243. rseg->last_del_marks = undo->del_marks;
  244. }
  245. }
  246. /**************************************************************************
  247. Frees an undo log segment which is in the history list. Cuts the end of the
  248. history list at the youngest undo log in this segment. */
  249. static
  250. void
  251. trx_purge_free_segment(
  252. /*===================*/
  253. trx_rseg_t* rseg, /* in: rollback segment */
  254. fil_addr_t hdr_addr, /* in: the file address of log_hdr */
  255. ulint n_removed_logs) /* in: count of how many undo logs we
  256. will cut off from the end of the
  257. history list */
  258. {
  259. page_t* undo_page;
  260. trx_rsegf_t* rseg_hdr;
  261. trx_ulogf_t* log_hdr;
  262. trx_usegf_t* seg_hdr;
  263. ibool freed;
  264. ulint seg_size;
  265. ulint hist_size;
  266. ibool marked = FALSE;
  267. mtr_t mtr;
  268. /* fputs("Freeing an update undo log segmentn", stderr); */
  269. #ifdef UNIV_SYNC_DEBUG
  270. ut_ad(mutex_own(&(purge_sys->mutex)));
  271. #endif /* UNIV_SYNC_DEBUG */
  272. loop:
  273. mtr_start(&mtr);
  274. mutex_enter(&(rseg->mutex));
  275. rseg_hdr = trx_rsegf_get(rseg->space, rseg->page_no, &mtr);
  276. undo_page = trx_undo_page_get(rseg->space, hdr_addr.page, &mtr);
  277. seg_hdr = undo_page + TRX_UNDO_SEG_HDR;
  278. log_hdr = undo_page + hdr_addr.boffset;
  279. /* Mark the last undo log totally purged, so that if the system
  280. crashes, the tail of the undo log will not get accessed again. The
  281. list of pages in the undo log tail gets inconsistent during the
  282. freeing of the segment, and therefore purge should not try to access
  283. them again. */
  284. if (!marked) {
  285. mlog_write_ulint(log_hdr + TRX_UNDO_DEL_MARKS, FALSE,
  286. MLOG_2BYTES, &mtr);
  287. marked = TRUE;
  288. }
  289. freed = fseg_free_step_not_header(seg_hdr + TRX_UNDO_FSEG_HEADER,
  290. &mtr);
  291. if (!freed) {
  292. mutex_exit(&(rseg->mutex));
  293. mtr_commit(&mtr);
  294. goto loop;
  295. }
  296. /* The page list may now be inconsistent, but the length field
  297. stored in the list base node tells us how big it was before we
  298. started the freeing. */
  299. seg_size = flst_get_len(seg_hdr + TRX_UNDO_PAGE_LIST, &mtr);
  300. /* We may free the undo log segment header page; it must be freed
  301. within the same mtr as the undo log header is removed from the
  302. history list: otherwise, in case of a database crash, the segment
  303. could become inaccessible garbage in the file space. */
  304. flst_cut_end(rseg_hdr + TRX_RSEG_HISTORY,
  305. log_hdr + TRX_UNDO_HISTORY_NODE, n_removed_logs, &mtr);
  306. mutex_enter(&kernel_mutex);
  307. ut_ad(trx_sys->rseg_history_len >= n_removed_logs);
  308. trx_sys->rseg_history_len -= n_removed_logs;
  309. mutex_exit(&kernel_mutex);
  310. freed = FALSE;
  311. while (!freed) {
  312. /* Here we assume that a file segment with just the header
  313. page can be freed in a few steps, so that the buffer pool
  314. is not flooded with bufferfixed pages: see the note in
  315. fsp0fsp.c. */
  316. freed = fseg_free_step(seg_hdr + TRX_UNDO_FSEG_HEADER,
  317. &mtr);
  318. }
  319. hist_size = mtr_read_ulint(rseg_hdr + TRX_RSEG_HISTORY_SIZE,
  320. MLOG_4BYTES, &mtr);
  321. ut_ad(hist_size >= seg_size);
  322. mlog_write_ulint(rseg_hdr + TRX_RSEG_HISTORY_SIZE,
  323. hist_size - seg_size, MLOG_4BYTES, &mtr);
  324. ut_ad(rseg->curr_size >= seg_size);
  325. rseg->curr_size -= seg_size;
  326. mutex_exit(&(rseg->mutex));
  327. mtr_commit(&mtr);
  328. }
  329. /************************************************************************
  330. Removes unnecessary history data from a rollback segment. */
  331. static
  332. void
  333. trx_purge_truncate_rseg_history(
  334. /*============================*/
  335. trx_rseg_t* rseg, /* in: rollback segment */
  336. dulint limit_trx_no, /* in: remove update undo logs whose
  337. trx number is < limit_trx_no */
  338. dulint limit_undo_no) /* in: if transaction number is equal
  339. to limit_trx_no, truncate undo records
  340. with undo number < limit_undo_no */
  341. {
  342. fil_addr_t hdr_addr;
  343. fil_addr_t prev_hdr_addr;
  344. trx_rsegf_t* rseg_hdr;
  345. page_t* undo_page;
  346. trx_ulogf_t* log_hdr;
  347. trx_usegf_t* seg_hdr;
  348. int cmp;
  349. ulint n_removed_logs = 0;
  350. mtr_t mtr;
  351. #ifdef UNIV_SYNC_DEBUG
  352. ut_ad(mutex_own(&(purge_sys->mutex)));
  353. #endif /* UNIV_SYNC_DEBUG */
  354. mtr_start(&mtr);
  355. mutex_enter(&(rseg->mutex));
  356. rseg_hdr = trx_rsegf_get(rseg->space, rseg->page_no, &mtr);
  357. hdr_addr = trx_purge_get_log_from_hist(
  358. flst_get_last(rseg_hdr + TRX_RSEG_HISTORY, &mtr));
  359. loop:
  360. if (hdr_addr.page == FIL_NULL) {
  361. mutex_exit(&(rseg->mutex));
  362. mtr_commit(&mtr);
  363. return;
  364. }
  365. undo_page = trx_undo_page_get(rseg->space, hdr_addr.page, &mtr);
  366. log_hdr = undo_page + hdr_addr.boffset;
  367.   cmp = ut_dulint_cmp(mach_read_from_8(log_hdr + TRX_UNDO_TRX_NO),
  368.      limit_trx_no);
  369. if (cmp == 0) {
  370. trx_undo_truncate_start(rseg, rseg->space, hdr_addr.page,
  371. hdr_addr.boffset, limit_undo_no);
  372. }
  373. if (cmp >= 0) {
  374. mutex_enter(&kernel_mutex);
  375. ut_a(trx_sys->rseg_history_len >= n_removed_logs);
  376. trx_sys->rseg_history_len -= n_removed_logs;
  377. mutex_exit(&kernel_mutex);
  378. flst_truncate_end(rseg_hdr + TRX_RSEG_HISTORY,
  379.      log_hdr + TRX_UNDO_HISTORY_NODE,
  380. n_removed_logs, &mtr);
  381. mutex_exit(&(rseg->mutex));
  382. mtr_commit(&mtr);
  383. return;
  384. }
  385. prev_hdr_addr = trx_purge_get_log_from_hist(
  386.   flst_get_prev_addr(log_hdr + TRX_UNDO_HISTORY_NODE,
  387. &mtr));
  388. n_removed_logs++;
  389. seg_hdr = undo_page + TRX_UNDO_SEG_HDR;
  390. if ((mach_read_from_2(seg_hdr + TRX_UNDO_STATE) == TRX_UNDO_TO_PURGE)
  391.      && (mach_read_from_2(log_hdr + TRX_UNDO_NEXT_LOG) == 0)) {
  392. /* We can free the whole log segment */
  393. mutex_exit(&(rseg->mutex));
  394. mtr_commit(&mtr);
  395. trx_purge_free_segment(rseg, hdr_addr, n_removed_logs);
  396. n_removed_logs = 0;
  397. } else {
  398. mutex_exit(&(rseg->mutex));
  399. mtr_commit(&mtr);
  400. }
  401. mtr_start(&mtr);
  402. mutex_enter(&(rseg->mutex));
  403. rseg_hdr = trx_rsegf_get(rseg->space, rseg->page_no, &mtr);
  404. hdr_addr = prev_hdr_addr;
  405. goto loop;
  406. }
  407. /************************************************************************
  408. Removes unnecessary history data from rollback segments. NOTE that when this
  409. function is called, the caller must not have any latches on undo log pages! */
  410. static
  411. void
  412. trx_purge_truncate_history(void)
  413. /*============================*/
  414. {
  415. trx_rseg_t* rseg;
  416. dulint limit_trx_no;
  417. dulint limit_undo_no;
  418. #ifdef UNIV_SYNC_DEBUG
  419. ut_ad(mutex_own(&(purge_sys->mutex)));
  420. #endif /* UNIV_SYNC_DEBUG */
  421. trx_purge_arr_get_biggest(purge_sys->arr, &limit_trx_no,
  422. &limit_undo_no);
  423. if (ut_dulint_cmp(limit_trx_no, ut_dulint_zero) == 0) {
  424. limit_trx_no = purge_sys->purge_trx_no;
  425. limit_undo_no = purge_sys->purge_undo_no;
  426. }
  427. /* We play safe and set the truncate limit at most to the purge view
  428. low_limit number, though this is not necessary */
  429. if (ut_dulint_cmp(limit_trx_no, purge_sys->view->low_limit_no) >= 0) {
  430. limit_trx_no = purge_sys->view->low_limit_no;
  431. limit_undo_no = ut_dulint_zero;
  432. }
  433. ut_ad((ut_dulint_cmp(limit_trx_no,
  434. purge_sys->view->low_limit_no) <= 0));
  435. rseg = UT_LIST_GET_FIRST(trx_sys->rseg_list);
  436. while (rseg) {
  437. trx_purge_truncate_rseg_history(rseg, limit_trx_no,
  438. limit_undo_no);
  439. rseg = UT_LIST_GET_NEXT(rseg_list, rseg);
  440. }
  441. }
  442. /************************************************************************
  443. Does a truncate if the purge array is empty. NOTE that when this function is
  444. called, the caller must not have any latches on undo log pages! */
  445. UNIV_INLINE
  446. ibool
  447. trx_purge_truncate_if_arr_empty(void)
  448. /*=================================*/
  449. /* out: TRUE if array empty */
  450. {
  451. #ifdef UNIV_SYNC_DEBUG
  452. ut_ad(mutex_own(&(purge_sys->mutex)));
  453. #endif /* UNIV_SYNC_DEBUG */
  454. if (purge_sys->arr->n_used == 0) {
  455. trx_purge_truncate_history();
  456. return(TRUE);
  457. }
  458. return(FALSE);
  459. }
  460. /***************************************************************************
  461. Updates the last not yet purged history log info in rseg when we have purged
  462. a whole undo log. Advances also purge_sys->purge_trx_no past the purged log. */
  463. static 
  464. void
  465. trx_purge_rseg_get_next_history_log(
  466. /*================================*/
  467. trx_rseg_t* rseg) /* in: rollback segment */
  468. {
  469. page_t*  undo_page;
  470. trx_ulogf_t* log_hdr;
  471. trx_usegf_t* seg_hdr;
  472. fil_addr_t prev_log_addr;
  473. dulint trx_no;
  474. ibool del_marks;
  475. mtr_t mtr;
  476. #ifdef UNIV_SYNC_DEBUG
  477. ut_ad(mutex_own(&(purge_sys->mutex)));
  478. #endif /* UNIV_SYNC_DEBUG */
  479. mutex_enter(&(rseg->mutex));
  480. ut_a(rseg->last_page_no != FIL_NULL);
  481. purge_sys->purge_trx_no = ut_dulint_add(rseg->last_trx_no, 1);
  482. purge_sys->purge_undo_no = ut_dulint_zero;
  483. purge_sys->next_stored = FALSE;
  484. mtr_start(&mtr);
  485. undo_page = trx_undo_page_get_s_latched(rseg->space,
  486. rseg->last_page_no, &mtr);
  487. log_hdr = undo_page + rseg->last_offset;
  488. seg_hdr = undo_page + TRX_UNDO_SEG_HDR;
  489. /* Increase the purge page count by one for every handled log */
  490. purge_sys->n_pages_handled++;
  491. prev_log_addr = trx_purge_get_log_from_hist(
  492.  flst_get_prev_addr(log_hdr + TRX_UNDO_HISTORY_NODE,
  493. &mtr));
  494. if (prev_log_addr.page == FIL_NULL) {
  495. /* No logs left in the history list */
  496. rseg->last_page_no = FIL_NULL;
  497. mutex_exit(&(rseg->mutex));
  498. mtr_commit(&mtr);
  499. mutex_enter(&kernel_mutex);
  500. /* Add debug code to track history list corruption reported
  501. on the MySQL mailing list on Nov 9, 2004. The fut0lst.c
  502. file-based list was corrupt. The prev node pointer was
  503. FIL_NULL, even though the list length was over 8 million nodes!
  504. We assume that purge truncates the history list in moderate
  505. size pieces, and if we here reach the head of the list, the
  506. list cannot be longer than 20 000 undo logs now. */
  507. if (trx_sys->rseg_history_len > 20000) {
  508. ut_print_timestamp(stderr);
  509. fprintf(stderr,
  510. "  InnoDB: Warning: purge reached the head of the history list,n"
  511. "InnoDB: but its length is still reported as %lu! Make a detailed bugn"
  512. "InnoDB: report, and post it to bugs.mysql.comn",
  513. (ulong)trx_sys->rseg_history_len);
  514. }
  515. mutex_exit(&kernel_mutex);
  516. return;
  517. }
  518. mutex_exit(&(rseg->mutex));
  519. mtr_commit(&mtr);
  520. /* Read the trx number and del marks from the previous log header */
  521. mtr_start(&mtr);
  522. log_hdr = trx_undo_page_get_s_latched(rseg->space,
  523. prev_log_addr.page, &mtr)
  524.   + prev_log_addr.boffset;
  525. trx_no = mach_read_from_8(log_hdr + TRX_UNDO_TRX_NO);
  526. del_marks = mach_read_from_2(log_hdr + TRX_UNDO_DEL_MARKS);
  527. mtr_commit(&mtr);
  528. mutex_enter(&(rseg->mutex));
  529. rseg->last_page_no = prev_log_addr.page;
  530. rseg->last_offset = prev_log_addr.boffset;
  531. rseg->last_trx_no = trx_no;
  532. rseg->last_del_marks = del_marks;
  533. mutex_exit(&(rseg->mutex));
  534. }
  535. /***************************************************************************
  536. Chooses the next undo log to purge and updates the info in purge_sys. This
  537. function is used to initialize purge_sys when the next record to purge is
  538. not known, and also to update the purge system info on the next record when
  539. purge has handled the whole undo log for a transaction. */
  540. static 
  541. void
  542. trx_purge_choose_next_log(void)
  543. /*===========================*/
  544. {
  545. trx_undo_rec_t* rec;
  546. trx_rseg_t* rseg;
  547. trx_rseg_t* min_rseg;
  548. dulint min_trx_no;
  549. ulint space = 0;   /* remove warning (??? bug ???) */
  550. ulint page_no = 0; /* remove warning (??? bug ???) */
  551. ulint offset = 0;  /* remove warning (??? bug ???) */
  552. mtr_t mtr;
  553. #ifdef UNIV_SYNC_DEBUG
  554. ut_ad(mutex_own(&(purge_sys->mutex)));
  555. #endif /* UNIV_SYNC_DEBUG */
  556. ut_ad(purge_sys->next_stored == FALSE);
  557. rseg = UT_LIST_GET_FIRST(trx_sys->rseg_list);
  558. min_trx_no = ut_dulint_max;
  559. min_rseg = NULL;
  560. while (rseg) {
  561. mutex_enter(&(rseg->mutex));
  562. if (rseg->last_page_no != FIL_NULL) {
  563. if ((min_rseg == NULL)
  564.     || (ut_dulint_cmp(min_trx_no, rseg->last_trx_no)
  565.      > 0)) {
  566. min_rseg = rseg;
  567. min_trx_no = rseg->last_trx_no;
  568. space = rseg->space;
  569. ut_a(space == 0); /* We assume in purge of
  570. externally stored fields
  571. that space id == 0 */
  572. page_no = rseg->last_page_no;
  573. offset = rseg->last_offset;
  574. }
  575. }
  576. mutex_exit(&(rseg->mutex));
  577. rseg = UT_LIST_GET_NEXT(rseg_list, rseg);
  578. }
  579. if (min_rseg == NULL) {
  580. return;
  581. }
  582. mtr_start(&mtr);
  583. if (!min_rseg->last_del_marks) {
  584. /* No need to purge this log */
  585. rec = &trx_purge_dummy_rec;
  586. } else {
  587. rec = trx_undo_get_first_rec(space, page_no, offset,
  588. RW_S_LATCH, &mtr);
  589. if (rec == NULL) {
  590. /* Undo log empty */
  591. rec = &trx_purge_dummy_rec;
  592. }
  593. }
  594. purge_sys->next_stored = TRUE;
  595. purge_sys->rseg = min_rseg;
  596. purge_sys->hdr_page_no = page_no;
  597. purge_sys->hdr_offset = offset;
  598. purge_sys->purge_trx_no = min_trx_no;
  599. if (rec == &trx_purge_dummy_rec) {
  600. purge_sys->purge_undo_no = ut_dulint_zero;
  601. purge_sys->page_no = page_no;
  602. purge_sys->offset = 0;
  603. } else {
  604. purge_sys->purge_undo_no = trx_undo_rec_get_undo_no(rec);
  605. purge_sys->page_no = buf_frame_get_page_no(rec);
  606. purge_sys->offset = rec - buf_frame_align(rec);
  607. }
  608. mtr_commit(&mtr);
  609. }
  610. /***************************************************************************
  611. Gets the next record to purge and updates the info in the purge system. */
  612. static
  613. trx_undo_rec_t*
  614. trx_purge_get_next_rec(
  615. /*===================*/
  616. /* out: copy of an undo log record or
  617. pointer to the dummy undo log record */
  618. mem_heap_t* heap) /* in: memory heap where copied */
  619. {
  620. trx_undo_rec_t* rec;
  621. trx_undo_rec_t* rec_copy;
  622. trx_undo_rec_t* rec2;
  623. trx_undo_rec_t* next_rec;
  624. page_t*  undo_page;
  625. page_t*  page;
  626. ulint offset;
  627. ulint page_no;
  628. ulint space;
  629. ulint type;
  630. ulint cmpl_info;
  631. mtr_t mtr;
  632. #ifdef UNIV_SYNC_DEBUG
  633. ut_ad(mutex_own(&(purge_sys->mutex)));
  634. #endif /* UNIV_SYNC_DEBUG */
  635. ut_ad(purge_sys->next_stored);
  636. space = purge_sys->rseg->space;
  637. page_no = purge_sys->page_no;
  638. offset = purge_sys->offset;
  639. if (offset == 0) {
  640. /* It is the dummy undo log record, which means that there is
  641. no need to purge this undo log */
  642. trx_purge_rseg_get_next_history_log(purge_sys->rseg);
  643. /* Look for the next undo log and record to purge */
  644. trx_purge_choose_next_log();
  645. return(&trx_purge_dummy_rec);
  646. }
  647. mtr_start(&mtr);
  648. undo_page = trx_undo_page_get_s_latched(space, page_no, &mtr);
  649. rec = undo_page + offset;
  650. rec2 = rec;
  651. for (;;) {
  652. /* Try first to find the next record which requires a purge
  653. operation from the same page of the same undo log */
  654. next_rec = trx_undo_page_get_next_rec(rec2,
  655. purge_sys->hdr_page_no,
  656. purge_sys->hdr_offset);
  657. if (next_rec == NULL) {
  658. rec2 = trx_undo_get_next_rec(rec2,
  659. purge_sys->hdr_page_no,
  660. purge_sys->hdr_offset, &mtr);
  661. break;
  662. }
  663. rec2 = next_rec;
  664. type = trx_undo_rec_get_type(rec2);
  665. if (type == TRX_UNDO_DEL_MARK_REC) {
  666. break;
  667. }     
  668. cmpl_info = trx_undo_rec_get_cmpl_info(rec2);
  669. if (trx_undo_rec_get_extern_storage(rec2)) {
  670. break;
  671. }
  672. if ((type == TRX_UNDO_UPD_EXIST_REC)
  673. && !(cmpl_info & UPD_NODE_NO_ORD_CHANGE)) {
  674.           break;
  675.     }
  676. }
  677. if (rec2 == NULL) {
  678. mtr_commit(&mtr);
  679. trx_purge_rseg_get_next_history_log(purge_sys->rseg);
  680. /* Look for the next undo log and record to purge */
  681. trx_purge_choose_next_log();
  682. mtr_start(&mtr);
  683. undo_page = trx_undo_page_get_s_latched(space, page_no, &mtr);
  684. rec = undo_page + offset;
  685. } else {
  686. page = buf_frame_align(rec2);
  687. purge_sys->purge_undo_no = trx_undo_rec_get_undo_no(rec2);
  688. purge_sys->page_no = buf_frame_get_page_no(page);
  689. purge_sys->offset = rec2 - page;
  690. if (undo_page != page) {
  691. /* We advance to a new page of the undo log: */
  692. purge_sys->n_pages_handled++;
  693. }
  694. }
  695. rec_copy = trx_undo_rec_copy(rec, heap);
  696. mtr_commit(&mtr);
  697. return(rec_copy);
  698. }
  699. /************************************************************************
  700. Fetches the next undo log record from the history list to purge. It must be
  701. released with the corresponding release function. */
  702. trx_undo_rec_t*
  703. trx_purge_fetch_next_rec(
  704. /*=====================*/
  705. /* out: copy of an undo log record or
  706. pointer to the dummy undo log record
  707. &trx_purge_dummy_rec, if the whole undo log
  708. can skipped in purge; NULL if none left */
  709. dulint* roll_ptr,/* out: roll pointer to undo record */
  710. trx_undo_inf_t** cell, /* out: storage cell for the record in the
  711. purge array */
  712. mem_heap_t* heap) /* in: memory heap where copied */
  713. {
  714. trx_undo_rec_t* undo_rec;
  715. mutex_enter(&(purge_sys->mutex));
  716. if (purge_sys->state == TRX_STOP_PURGE) {
  717. trx_purge_truncate_if_arr_empty();
  718. mutex_exit(&(purge_sys->mutex));
  719. return(NULL);
  720. }
  721. if (!purge_sys->next_stored) {
  722. trx_purge_choose_next_log();
  723. if (!purge_sys->next_stored) {
  724. purge_sys->state = TRX_STOP_PURGE;
  725. trx_purge_truncate_if_arr_empty();
  726. if (srv_print_thread_releases) {
  727. fprintf(stderr,
  728. "Purge: No logs left in the history list; pages handled %lun",
  729. (ulong) purge_sys->n_pages_handled);
  730. }
  731. mutex_exit(&(purge_sys->mutex));
  732. return(NULL);
  733. }
  734. }
  735. if (purge_sys->n_pages_handled >= purge_sys->handle_limit) {
  736. purge_sys->state = TRX_STOP_PURGE;
  737. trx_purge_truncate_if_arr_empty();
  738. mutex_exit(&(purge_sys->mutex));
  739. return(NULL);
  740. }
  741. if (ut_dulint_cmp(purge_sys->purge_trx_no,
  742. purge_sys->view->low_limit_no) >= 0) {
  743. purge_sys->state = TRX_STOP_PURGE;
  744. trx_purge_truncate_if_arr_empty();
  745. mutex_exit(&(purge_sys->mutex));
  746. return(NULL);
  747. }
  748. /* fprintf(stderr, "Thread %lu purging trx %lu undo record %lun",
  749. os_thread_get_curr_id(),
  750. ut_dulint_get_low(purge_sys->purge_trx_no),
  751. ut_dulint_get_low(purge_sys->purge_undo_no)); */
  752. *roll_ptr = trx_undo_build_roll_ptr(FALSE, (purge_sys->rseg)->id,
  753. purge_sys->page_no,
  754. purge_sys->offset);
  755. *cell = trx_purge_arr_store_info(purge_sys->purge_trx_no,
  756.  purge_sys->purge_undo_no);
  757. ut_ad(ut_dulint_cmp(purge_sys->purge_trx_no,
  758.     (purge_sys->view)->low_limit_no) < 0);
  759. /* The following call will advance the stored values of purge_trx_no
  760. and purge_undo_no, therefore we had to store them first */
  761. undo_rec = trx_purge_get_next_rec(heap);
  762. mutex_exit(&(purge_sys->mutex));
  763. return(undo_rec);
  764. }
  765. /***********************************************************************
  766. Releases a reserved purge undo record. */
  767. void
  768. trx_purge_rec_release(
  769. /*==================*/
  770. trx_undo_inf_t* cell) /* in: storage cell */
  771. {
  772. trx_undo_arr_t* arr;
  773. mutex_enter(&(purge_sys->mutex));
  774. arr = purge_sys->arr;
  775. trx_purge_arr_remove_info(cell);
  776. mutex_exit(&(purge_sys->mutex));
  777. }
  778. /***********************************************************************
  779. This function runs a purge batch. */
  780. ulint
  781. trx_purge(void)
  782. /*===========*/
  783. /* out: number of undo log pages handled in
  784. the batch */
  785. {
  786. que_thr_t* thr;
  787. /* que_thr_t* thr2; */
  788. ulint old_pages_handled;
  789. mutex_enter(&(purge_sys->mutex));
  790. if (purge_sys->trx->n_active_thrs > 0) {
  791. mutex_exit(&(purge_sys->mutex));
  792. /* Should not happen */
  793. ut_error;
  794. return(0);
  795. }
  796. rw_lock_x_lock(&(purge_sys->latch));
  797. mutex_enter(&kernel_mutex);
  798. /* Close and free the old purge view */
  799. read_view_close(purge_sys->view);
  800. purge_sys->view = NULL;
  801. mem_heap_empty(purge_sys->heap);
  802. /* Determine how much data manipulation language (DML) statements
  803. need to be delayed in order to reduce the lagging of the purge
  804. thread. */
  805. srv_dml_needed_delay = 0; /* in microseconds; default: no delay */
  806. /* If we cannot advance the 'purge view' because of an old
  807. 'consistent read view', then the DML statements cannot be delayed.
  808. Also, srv_max_purge_lag <= 0 means 'infinity'. */
  809. if (srv_max_purge_lag > 0
  810. && !UT_LIST_GET_LAST(trx_sys->view_list)) {
  811. float ratio = (float) trx_sys->rseg_history_len
  812. / srv_max_purge_lag;
  813. if (ratio > ULINT_MAX / 10000) {
  814. /* Avoid overflow: maximum delay is 4295 seconds */
  815. srv_dml_needed_delay = ULINT_MAX;
  816. } else if (ratio > 1) {
  817. /* If the history list length exceeds the
  818. innodb_max_purge_lag, the
  819. data manipulation statements are delayed
  820. by at least 5000 microseconds. */
  821. srv_dml_needed_delay = (ulint) ((ratio - .5) * 10000);
  822. }
  823. }
  824. purge_sys->view = read_view_oldest_copy_or_open_new(NULL,
  825. purge_sys->heap);
  826. mutex_exit(&kernel_mutex);
  827. rw_lock_x_unlock(&(purge_sys->latch));
  828. purge_sys->state = TRX_PURGE_ON;
  829. /* Handle at most 20 undo log pages in one purge batch */
  830. purge_sys->handle_limit = purge_sys->n_pages_handled + 20;
  831. old_pages_handled = purge_sys->n_pages_handled;
  832. mutex_exit(&(purge_sys->mutex));
  833. mutex_enter(&kernel_mutex);
  834. thr = que_fork_start_command(purge_sys->query);
  835. ut_ad(thr);
  836. /* thr2 = que_fork_start_command(purge_sys->query);
  837. ut_ad(thr2); */
  838. mutex_exit(&kernel_mutex);
  839. /* srv_que_task_enqueue(thr2); */
  840. if (srv_print_thread_releases) {
  841. fputs("Starting purgen", stderr);
  842. }
  843. que_run_threads(thr);
  844. if (srv_print_thread_releases) {
  845. fprintf(stderr,
  846. "Purge ends; pages handled %lun",
  847. (ulong) purge_sys->n_pages_handled);
  848. }
  849. return(purge_sys->n_pages_handled - old_pages_handled);
  850. }
  851. /**********************************************************************
  852. Prints information of the purge system to stderr. */
  853. void
  854. trx_purge_sys_print(void)
  855. /*=====================*/
  856. {
  857. fprintf(stderr, "InnoDB: Purge system view:n");
  858. read_view_print(purge_sys->view);
  859. fprintf(stderr, "InnoDB: Purge trx n:o %lu %lu, undo n_o %lu %lun",
  860. (ulong) ut_dulint_get_high(purge_sys->purge_trx_no),
  861. (ulong) ut_dulint_get_low(purge_sys->purge_trx_no),
  862. (ulong) ut_dulint_get_high(purge_sys->purge_undo_no),
  863. (ulong) ut_dulint_get_low(purge_sys->purge_undo_no));
  864. fprintf(stderr,
  865. "InnoDB: Purge next stored %lu, page_no %lu, offset %lu,n"
  866. "InnoDB: Purge hdr_page_no %lu, hdr_offset %lun",
  867. (ulong) purge_sys->next_stored,
  868. (ulong) purge_sys->page_no,
  869. (ulong) purge_sys->offset,
  870. (ulong) purge_sys->hdr_page_no,
  871. (ulong) purge_sys->hdr_offset);
  872. }