trx0rec.c
上传用户:romrleung
上传日期:2022-05-23
资源大小:18897k
文件大小:35k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /******************************************************
  2. Transaction undo log record
  3. (c) 1996 Innobase Oy
  4. Created 3/26/1996 Heikki Tuuri
  5. *******************************************************/
  6. #include "trx0rec.h"
  7. #ifdef UNIV_NONINL
  8. #include "trx0rec.ic"
  9. #endif
  10. #include "fsp0fsp.h"
  11. #include "mach0data.h"
  12. #include "trx0rseg.h"
  13. #include "trx0trx.h"
  14. #include "trx0undo.h"
  15. #include "dict0dict.h"
  16. #include "ut0mem.h"
  17. #include "row0upd.h"
  18. #include "que0que.h"
  19. #include "trx0purge.h"
  20. #include "row0row.h"
  21. /*=========== UNDO LOG RECORD CREATION AND DECODING ====================*/
  22. /**************************************************************************
  23. Writes the mtr log entry of the inserted undo log record on the undo log
  24. page. */
  25. UNIV_INLINE
  26. void
  27. trx_undof_page_add_undo_rec_log(
  28. /*============================*/
  29. page_t* undo_page, /* in: undo log page */
  30. ulint old_free, /* in: start offset of the inserted entry */
  31. ulint new_free, /* in: end offset of the entry */
  32. mtr_t* mtr) /* in: mtr */
  33. {
  34. byte* log_ptr;
  35. ulint len;
  36. log_ptr = mlog_open(mtr, 30 + MLOG_BUF_MARGIN);
  37. if (log_ptr == NULL) {
  38. return;
  39. }
  40. log_ptr = mlog_write_initial_log_record_fast(undo_page,
  41. MLOG_UNDO_INSERT, log_ptr, mtr);
  42. len = new_free - old_free - 4;
  43. mach_write_to_2(log_ptr, len);
  44. log_ptr += 2;
  45. if (len < 256) {
  46. ut_memcpy(log_ptr, undo_page + old_free + 2, len);
  47. log_ptr += len;
  48. }
  49. mlog_close(mtr, log_ptr);
  50. if (len >= MLOG_BUF_MARGIN) {
  51. mlog_catenate_string(mtr, undo_page + old_free + 2, len);
  52. }
  53. }
  54. /***************************************************************
  55. Parses a redo log record of adding an undo log record. */
  56. byte*
  57. trx_undo_parse_add_undo_rec(
  58. /*========================*/
  59. /* out: end of log record or NULL */
  60. byte* ptr, /* in: buffer */
  61. byte* end_ptr,/* in: buffer end */
  62. page_t* page) /* in: page or NULL */
  63. {
  64. ulint len;
  65. byte* rec;
  66. ulint first_free;
  67. if (end_ptr < ptr + 2) {
  68. return(NULL);
  69. }
  70. len = mach_read_from_2(ptr);
  71. ptr += 2;
  72. if (end_ptr < ptr + len) {
  73. return(NULL);
  74. }
  75. if (page == NULL) {
  76. return(ptr + len);
  77. }
  78. first_free = mach_read_from_2(page + TRX_UNDO_PAGE_HDR
  79. + TRX_UNDO_PAGE_FREE);
  80. rec = page + first_free;
  81. mach_write_to_2(rec, first_free + 4 + len);
  82. mach_write_to_2(rec + 2 + len, first_free);
  83. mach_write_to_2(page + TRX_UNDO_PAGE_HDR + TRX_UNDO_PAGE_FREE,
  84. first_free + 4 + len);
  85. ut_memcpy(rec + 2, ptr, len);
  86. return(ptr + len);
  87. }
  88. /**************************************************************************
  89. Calculates the free space left for extending an undo log record. */
  90. UNIV_INLINE
  91. ulint
  92. trx_undo_left(
  93. /*==========*/
  94. /* out: bytes left */
  95. page_t* page, /* in: undo log page */
  96. byte* ptr) /* in: pointer to page */
  97. {
  98. /* The '- 10' is a safety margin, in case we have some small
  99. calculation error below */
  100. return(UNIV_PAGE_SIZE - (ptr - page) - 10 - FIL_PAGE_DATA_END);
  101. }
  102. /**************************************************************************
  103. Reports in the undo log of an insert of a clustered index record. */
  104. static
  105. ulint
  106. trx_undo_page_report_insert(
  107. /*========================*/
  108. /* out: offset of the inserted entry
  109. on the page if succeed, 0 if fail */
  110. page_t*  undo_page, /* in: undo log page */
  111. trx_t* trx, /* in: transaction */
  112. dict_index_t* index, /* in: clustered index */
  113. dtuple_t* clust_entry, /* in: index entry which will be
  114. inserted to the clustered index */
  115. mtr_t* mtr) /* in: mtr */
  116. {
  117. ulint first_free;
  118. byte* ptr;
  119. ulint len;
  120. dfield_t* field;
  121. ulint flen;
  122. ulint i;
  123. ut_ad(mach_read_from_2(undo_page + TRX_UNDO_PAGE_HDR
  124. + TRX_UNDO_PAGE_TYPE) == TRX_UNDO_INSERT);
  125. first_free = mach_read_from_2(undo_page + TRX_UNDO_PAGE_HDR
  126. + TRX_UNDO_PAGE_FREE);
  127. ptr = undo_page + first_free;
  128. ut_ad(first_free <= UNIV_PAGE_SIZE);
  129. if (trx_undo_left(undo_page, ptr) < 30) {
  130. /* NOTE: the value 30 must be big enough such that the general
  131. fields written below fit on the undo log page */
  132. return(0);
  133. }
  134. /* Reserve 2 bytes for the pointer to the next undo log record */
  135. ptr += 2;
  136. /* Store first some general parameters to the undo log */ 
  137. mach_write_to_1(ptr, TRX_UNDO_INSERT_REC);
  138. ptr++;
  139. len = mach_dulint_write_much_compressed(ptr, trx->undo_no);
  140. ptr += len;
  141. len = mach_dulint_write_much_compressed(ptr, (index->table)->id);
  142. ptr += len;
  143. /*----------------------------------------*/
  144. /* Store then the fields required to uniquely determine the record
  145. to be inserted in the clustered index */
  146. for (i = 0; i < dict_index_get_n_unique(index); i++) {
  147. field = dtuple_get_nth_field(clust_entry, i);
  148. flen = dfield_get_len(field);
  149. if (trx_undo_left(undo_page, ptr) < 5) {
  150. return(0);
  151. }
  152. len = mach_write_compressed(ptr, flen); 
  153. ptr += len;
  154. if (flen != UNIV_SQL_NULL) {
  155. if (trx_undo_left(undo_page, ptr) < flen) {
  156. return(0);
  157. }
  158. ut_memcpy(ptr, dfield_get_data(field), flen);
  159. ptr += flen;
  160. }
  161. }
  162. if (trx_undo_left(undo_page, ptr) < 2) {
  163. return(0);
  164. }
  165. /*----------------------------------------*/
  166. /* Write pointers to the previous and the next undo log records */
  167. if (trx_undo_left(undo_page, ptr) < 2) {
  168. return(0);
  169. }
  170. mach_write_to_2(ptr, first_free);
  171. ptr += 2;
  172. mach_write_to_2(undo_page + first_free, ptr - undo_page);
  173. mach_write_to_2(undo_page + TRX_UNDO_PAGE_HDR + TRX_UNDO_PAGE_FREE,
  174. ptr - undo_page);
  175. /* Write the log entry to the REDO log of this change in the UNDO
  176.  log */
  177. trx_undof_page_add_undo_rec_log(undo_page, first_free,
  178. ptr - undo_page, mtr);
  179. return(first_free);
  180. }
  181. /**************************************************************************
  182. Reads from an undo log record the general parameters. */
  183. byte*
  184. trx_undo_rec_get_pars(
  185. /*==================*/
  186. /* out: remaining part of undo log
  187. record after reading these values */
  188. trx_undo_rec_t* undo_rec, /* in: undo log record */
  189. ulint* type, /* out: undo record type:
  190. TRX_UNDO_INSERT_REC, ... */
  191. ulint* cmpl_info, /* out: compiler info, relevant only
  192. for update type records */
  193. ibool* updated_extern, /* out: TRUE if we updated an
  194. externally stored fild */
  195. dulint* undo_no, /* out: undo log record number */
  196. dulint* table_id) /* out: table id */
  197. {
  198. byte* ptr;
  199. ulint len;
  200. ulint type_cmpl;
  201. ptr = undo_rec + 2;
  202. type_cmpl = mach_read_from_1(ptr);
  203. ptr++;
  204. if (type_cmpl & TRX_UNDO_UPD_EXTERN) {
  205. *updated_extern = TRUE;
  206. type_cmpl -= TRX_UNDO_UPD_EXTERN;
  207. } else {
  208. *updated_extern = FALSE;
  209. }
  210. *type = type_cmpl & (TRX_UNDO_CMPL_INFO_MULT - 1);
  211. *cmpl_info = type_cmpl / TRX_UNDO_CMPL_INFO_MULT;
  212. *undo_no = mach_dulint_read_much_compressed(ptr); 
  213. len = mach_dulint_get_much_compressed_size(*undo_no);
  214. ptr += len;
  215. *table_id = mach_dulint_read_much_compressed(ptr); 
  216. len = mach_dulint_get_much_compressed_size(*table_id);
  217. ptr += len;
  218. return(ptr);
  219. }
  220. /**************************************************************************
  221. Reads from an undo log record a stored column value. */
  222. static
  223. byte*
  224. trx_undo_rec_get_col_val(
  225. /*=====================*/
  226. /* out: remaining part of undo log record after
  227. reading these values */
  228. byte* ptr, /* in: pointer to remaining part of undo log record */
  229. byte** field, /* out: pointer to stored field */
  230. ulint* len) /* out: length of the field, or UNIV_SQL_NULL */
  231. {
  232. *len = mach_read_compressed(ptr); 
  233. ptr += mach_get_compressed_size(*len);
  234. *field = ptr;
  235. if (*len != UNIV_SQL_NULL) {
  236. if (*len >= UNIV_EXTERN_STORAGE_FIELD) {
  237. ptr += (*len - UNIV_EXTERN_STORAGE_FIELD);
  238. } else {
  239. ptr += *len;
  240. }
  241. }
  242. return(ptr);
  243. }
  244. /***********************************************************************
  245. Builds a row reference from an undo log record. */
  246. byte*
  247. trx_undo_rec_get_row_ref(
  248. /*=====================*/
  249. /* out: pointer to remaining part of undo
  250. record */
  251. byte* ptr, /* in: remaining part of a copy of an undo log
  252. record, at the start of the row reference;
  253. NOTE that this copy of the undo log record must
  254. be preserved as long as the row reference is
  255. used, as we do NOT copy the data in the
  256. record! */
  257. dict_index_t* index, /* in: clustered index */
  258. dtuple_t** ref, /* out, own: row reference */
  259. mem_heap_t* heap) /* in: memory heap from which the memory
  260. needed is allocated */
  261. {
  262. dfield_t* dfield;
  263. byte* field;
  264. ulint len;
  265. ulint ref_len;
  266. ulint i;
  267. ut_ad(index && ptr && ref && heap);
  268. ut_a(index->type & DICT_CLUSTERED);
  269. ref_len = dict_index_get_n_unique(index);
  270. *ref = dtuple_create(heap, ref_len);
  271. dict_index_copy_types(*ref, index, ref_len);
  272. for (i = 0; i < ref_len; i++) {
  273. dfield = dtuple_get_nth_field(*ref, i);
  274. ptr = trx_undo_rec_get_col_val(ptr, &field, &len);
  275. dfield_set_data(dfield, field, len);
  276. }
  277. return(ptr);
  278. }
  279. /***********************************************************************
  280. Skips a row reference from an undo log record. */
  281. byte*
  282. trx_undo_rec_skip_row_ref(
  283. /*======================*/
  284. /* out: pointer to remaining part of undo
  285. record */
  286. byte* ptr, /* in: remaining part in update undo log
  287. record, at the start of the row reference */
  288. dict_index_t* index) /* in: clustered index */
  289. {
  290. byte* field;
  291. ulint len;
  292. ulint ref_len;
  293. ulint i;
  294. ut_ad(index && ptr);
  295. ut_a(index->type & DICT_CLUSTERED);
  296. ref_len = dict_index_get_n_unique(index);
  297. for (i = 0; i < ref_len; i++) {
  298. ptr = trx_undo_rec_get_col_val(ptr, &field, &len);
  299. }
  300. return(ptr);
  301. }
  302. /**************************************************************************
  303. Reports in the undo log of an update or delete marking of a clustered index
  304. record. */
  305. static
  306. ulint
  307. trx_undo_page_report_modify(
  308. /*========================*/
  309. /* out: byte offset of the inserted
  310. undo log entry on the page if succeed,
  311. 0 if fail */
  312. page_t*  undo_page, /* in: undo log page */
  313. trx_t* trx, /* in: transaction */
  314. dict_index_t* index, /* in: clustered index where update or
  315. delete marking is done */
  316. rec_t* rec, /* in: clustered index record which
  317. has NOT yet been modified */
  318. upd_t* update, /* in: update vector which tells the
  319. columns to be updated; in the case of
  320. a delete, this should be set to NULL */
  321. ulint cmpl_info, /* in: compiler info on secondary
  322. index updates */
  323. mtr_t* mtr) /* in: mtr */
  324. {
  325. dict_table_t* table;
  326. upd_field_t* upd_field;
  327. dict_col_t* col;
  328. ulint first_free;
  329. byte* ptr;
  330. ulint len;
  331. byte*  field;
  332. ulint flen;
  333. ulint pos;
  334. dulint roll_ptr;
  335. dulint trx_id;
  336. ulint bits;
  337. ulint col_no;
  338. byte* old_ptr;
  339. ulint type_cmpl;
  340. byte* type_cmpl_ptr;
  341. ulint i;
  342. ut_a(index->type & DICT_CLUSTERED);
  343. ut_ad(mach_read_from_2(undo_page + TRX_UNDO_PAGE_HDR
  344. + TRX_UNDO_PAGE_TYPE) == TRX_UNDO_UPDATE);
  345. table = index->table;
  346. first_free = mach_read_from_2(undo_page + TRX_UNDO_PAGE_HDR
  347. + TRX_UNDO_PAGE_FREE);
  348. ptr = undo_page + first_free;
  349. ut_ad(first_free <= UNIV_PAGE_SIZE);
  350. if (trx_undo_left(undo_page, ptr) < 50) {
  351. /* NOTE: the value 50 must be big enough so that the general
  352. fields written below fit on the undo log page */
  353. return(0);
  354. }
  355. /* Reserve 2 bytes for the pointer to the next undo log record */
  356. ptr += 2;
  357. /* Store first some general parameters to the undo log */
  358. if (update) {
  359. if (rec_get_deleted_flag(rec)) {
  360. type_cmpl = TRX_UNDO_UPD_DEL_REC;
  361. } else {
  362. type_cmpl = TRX_UNDO_UPD_EXIST_REC;
  363. }
  364. } else {
  365. type_cmpl = TRX_UNDO_DEL_MARK_REC;
  366. }
  367. type_cmpl = type_cmpl | (cmpl_info * TRX_UNDO_CMPL_INFO_MULT);
  368. mach_write_to_1(ptr, type_cmpl);
  369. type_cmpl_ptr = ptr;
  370. ptr++;
  371. len = mach_dulint_write_much_compressed(ptr, trx->undo_no);
  372. ptr += len;
  373. len = mach_dulint_write_much_compressed(ptr, table->id);
  374. ptr += len;
  375. /*----------------------------------------*/
  376. /* Store the state of the info bits */
  377. bits = rec_get_info_bits(rec);
  378. mach_write_to_1(ptr, bits);
  379. ptr += 1;
  380. /* Store the values of the system columns */
  381. trx_id = dict_index_rec_get_sys_col(index, DATA_TRX_ID, rec);
  382. roll_ptr = dict_index_rec_get_sys_col(index, DATA_ROLL_PTR, rec);
  383. len = mach_dulint_write_compressed(ptr, trx_id);
  384. ptr += len;
  385. len = mach_dulint_write_compressed(ptr, roll_ptr);
  386. ptr += len;
  387. /*----------------------------------------*/
  388. /* Store then the fields required to uniquely determine the
  389. record which will be modified in the clustered index */
  390. for (i = 0; i < dict_index_get_n_unique(index); i++) {
  391. field = rec_get_nth_field(rec, i, &flen);
  392. if (trx_undo_left(undo_page, ptr) < 4) {
  393. return(0);
  394. }
  395. len = mach_write_compressed(ptr, flen); 
  396. ptr += len;
  397. if (flen != UNIV_SQL_NULL) {
  398. if (trx_undo_left(undo_page, ptr) < flen) {
  399. return(0);
  400. }
  401. ut_memcpy(ptr, field, flen);
  402. ptr += flen;
  403. }
  404. }
  405. /*----------------------------------------*/
  406. /* Save to the undo log the old values of the columns to be updated. */
  407. if (update) {
  408.     if (trx_undo_left(undo_page, ptr) < 5) {
  409. return(0);
  410.     }
  411.     len = mach_write_compressed(ptr, upd_get_n_fields(update));
  412.     ptr += len;
  413.     for (i = 0; i < upd_get_n_fields(update); i++) {
  414. upd_field = upd_get_nth_field(update, i);
  415. pos = upd_field->field_no;
  416. /* Write field number to undo log */
  417. if (trx_undo_left(undo_page, ptr) < 5) {
  418. return(0);
  419. }
  420. len = mach_write_compressed(ptr, pos);
  421. ptr += len;
  422. /* Save the old value of field */
  423. field = rec_get_nth_field(rec, pos, &flen);
  424. if (trx_undo_left(undo_page, ptr) < 5) {
  425. return(0);
  426. }
  427. if (rec_get_nth_field_extern_bit(rec, pos)) {
  428. /* If a field has external storage, we add to
  429. flen the flag */
  430. len = mach_write_compressed(ptr,
  431. UNIV_EXTERN_STORAGE_FIELD + flen);
  432. /* Notify purge that it eventually has to free the old
  433. externally stored field */
  434. trx->update_undo->del_marks = TRUE;
  435. *type_cmpl_ptr = *type_cmpl_ptr | TRX_UNDO_UPD_EXTERN;
  436. } else {
  437. len = mach_write_compressed(ptr, flen);
  438. }
  439. ptr += len;
  440. if (flen != UNIV_SQL_NULL) {
  441. if (trx_undo_left(undo_page, ptr) < flen) {
  442. return(0);
  443. }
  444. ut_memcpy(ptr, field, flen);
  445. ptr += flen;
  446. }
  447.     }
  448. }
  449. /*----------------------------------------*/
  450. /* In the case of a delete marking, and also in the case of an update
  451. where any ordering field of any index changes, store the values of all
  452. columns which occur as ordering fields in any index. This info is used
  453. in the purge of old versions where we use it to build and search the
  454. delete marked index records, to look if we can remove them from the
  455. index tree. Note that starting from 4.0.14 also externally stored
  456. fields can be ordering in some index. But we always store at least
  457. 384 first bytes locally to the clustered index record, which means
  458. we can construct the column prefix fields in the index from the
  459. stored data. */
  460. if (!update || !(cmpl_info & UPD_NODE_NO_ORD_CHANGE)) {     
  461.     trx->update_undo->del_marks = TRUE;
  462.     if (trx_undo_left(undo_page, ptr) < 5) {
  463. return(0);
  464.     }
  465.     
  466.     old_ptr = ptr;
  467.     /* Reserve 2 bytes to write the number of bytes the stored fields
  468.     take in this undo record */
  469.     ptr += 2;
  470.     for (col_no = 0; col_no < dict_table_get_n_cols(table); col_no++) {
  471.      col = dict_table_get_nth_col(table, col_no);
  472.      if (col->ord_part > 0) {
  473.     
  474. pos = dict_index_get_nth_col_pos(index, col_no);
  475. /* Write field number to undo log */
  476. if (trx_undo_left(undo_page, ptr) < 5) {
  477. return(0);
  478. }
  479. len = mach_write_compressed(ptr, pos);
  480. ptr += len;
  481. /* Save the old value of field */
  482. field = rec_get_nth_field(rec, pos, &flen);
  483. if (trx_undo_left(undo_page, ptr) < 5) {
  484. return(0);
  485. }
  486. len = mach_write_compressed(ptr, flen);
  487. ptr += len;
  488. if (flen != UNIV_SQL_NULL) {
  489. if (trx_undo_left(undo_page, ptr) < flen) {
  490. return(0);
  491. }
  492. ut_memcpy(ptr, field, flen);
  493. ptr += flen;
  494. }
  495. }
  496.     }
  497.     mach_write_to_2(old_ptr, ptr - old_ptr);     
  498. }
  499. /*----------------------------------------*/
  500. /* Write pointers to the previous and the next undo log records */
  501. if (trx_undo_left(undo_page, ptr) < 2) {
  502. return(0);
  503. }
  504. mach_write_to_2(ptr, first_free);
  505. ptr += 2;
  506. mach_write_to_2(undo_page + first_free, ptr - undo_page);
  507. mach_write_to_2(undo_page + TRX_UNDO_PAGE_HDR + TRX_UNDO_PAGE_FREE,
  508. ptr - undo_page);
  509. /* Write to the REDO log about this change in the UNDO log */
  510. trx_undof_page_add_undo_rec_log(undo_page, first_free,
  511. ptr - undo_page, mtr);
  512. return(first_free);
  513. }
  514. /**************************************************************************
  515. Reads from an undo log update record the system field values of the old
  516. version. */
  517. byte*
  518. trx_undo_update_rec_get_sys_cols(
  519. /*=============================*/
  520. /* out: remaining part of undo log
  521. record after reading these values */
  522. byte* ptr, /* in: remaining part of undo log
  523. record after reading general
  524. parameters */
  525. dulint* trx_id, /* out: trx id */
  526. dulint* roll_ptr, /* out: roll ptr */
  527. ulint* info_bits) /* out: info bits state */
  528. {
  529. ulint len;
  530. /* Read the state of the info bits */
  531. *info_bits = mach_read_from_1(ptr);
  532. ptr += 1;
  533. /* Read the values of the system columns */
  534. *trx_id = mach_dulint_read_compressed(ptr); 
  535. len = mach_dulint_get_compressed_size(*trx_id);
  536. ptr += len;
  537. *roll_ptr = mach_dulint_read_compressed(ptr); 
  538. len = mach_dulint_get_compressed_size(*roll_ptr);
  539. ptr += len;
  540. return(ptr);
  541. }
  542. /**************************************************************************
  543. Reads from an update undo log record the number of updated fields. */
  544. UNIV_INLINE
  545. byte*
  546. trx_undo_update_rec_get_n_upd_fields(
  547. /*=================================*/
  548. /* out: remaining part of undo log record after
  549. reading this value */
  550. byte* ptr, /* in: pointer to remaining part of undo log record */
  551. ulint* n) /* out: number of fields */
  552. {
  553. *n = mach_read_compressed(ptr); 
  554. ptr += mach_get_compressed_size(*n);
  555. return(ptr);
  556. }
  557. /**************************************************************************
  558. Reads from an update undo log record a stored field number. */
  559. UNIV_INLINE
  560. byte*
  561. trx_undo_update_rec_get_field_no(
  562. /*=============================*/
  563. /* out: remaining part of undo log record after
  564. reading this value */
  565. byte* ptr, /* in: pointer to remaining part of undo log record */
  566. ulint* field_no)/* out: field number */
  567. {
  568. *field_no = mach_read_compressed(ptr); 
  569. ptr += mach_get_compressed_size(*field_no);
  570. return(ptr);
  571. }
  572. /***********************************************************************
  573. Builds an update vector based on a remaining part of an undo log record. */
  574. byte*
  575. trx_undo_update_rec_get_update(
  576. /*===========================*/
  577. /* out: remaining part of the record,
  578. NULL if an error detected, which means that
  579. the record is corrupted */
  580. byte* ptr, /* in: remaining part in update undo log
  581. record, after reading the row reference
  582. NOTE that this copy of the undo log record must
  583. be preserved as long as the update vector is
  584. used, as we do NOT copy the data in the
  585. record! */
  586. dict_index_t* index, /* in: clustered index */
  587. ulint type, /* in: TRX_UNDO_UPD_EXIST_REC,
  588. TRX_UNDO_UPD_DEL_REC, or
  589. TRX_UNDO_DEL_MARK_REC; in the last case,
  590. only trx id and roll ptr fields are added to
  591. the update vector */
  592. dulint trx_id, /* in: transaction id from this undo record */
  593. dulint roll_ptr,/* in: roll pointer from this undo record */
  594. ulint info_bits,/* in: info bits from this undo record */
  595. trx_t* trx, /* in: transaction */
  596. mem_heap_t* heap, /* in: memory heap from which the memory
  597. needed is allocated */
  598. upd_t** upd) /* out, own: update vector */
  599. {
  600. upd_field_t* upd_field;
  601. upd_t* update;
  602. ulint n_fields;
  603. byte* buf;
  604. byte* field;
  605. ulint len;
  606. ulint field_no;
  607. ulint i;
  608. ut_a(index->type & DICT_CLUSTERED);
  609. if (type != TRX_UNDO_DEL_MARK_REC) {
  610. ptr = trx_undo_update_rec_get_n_upd_fields(ptr, &n_fields);
  611. } else {
  612. n_fields = 0;
  613. }
  614. update = upd_create(n_fields + 2, heap);
  615. update->info_bits = info_bits;
  616. /* Store first trx id and roll ptr to update vector */
  617. upd_field = upd_get_nth_field(update, n_fields);
  618. buf = mem_heap_alloc(heap, DATA_TRX_ID_LEN);
  619. trx_write_trx_id(buf, trx_id);
  620. upd_field_set_field_no(upd_field,
  621. dict_index_get_sys_col_pos(index, DATA_TRX_ID),
  622. index, trx);
  623. dfield_set_data(&(upd_field->new_val), buf, DATA_TRX_ID_LEN);
  624. upd_field = upd_get_nth_field(update, n_fields + 1);
  625. buf = mem_heap_alloc(heap, DATA_ROLL_PTR_LEN);
  626. trx_write_roll_ptr(buf, roll_ptr);
  627. upd_field_set_field_no(upd_field,
  628. dict_index_get_sys_col_pos(index, DATA_ROLL_PTR),
  629. index, trx);
  630. dfield_set_data(&(upd_field->new_val), buf, DATA_ROLL_PTR_LEN);
  631. /* Store then the updated ordinary columns to the update vector */
  632. for (i = 0; i < n_fields; i++) {
  633. ptr = trx_undo_update_rec_get_field_no(ptr, &field_no);
  634. if (field_no >= dict_index_get_n_fields(index)) {
  635. fprintf(stderr,
  636. "InnoDB: Error: trying to access update undo rec field %lu in ", (ulong) field_no);
  637. dict_index_name_print(stderr, trx, index);
  638. fprintf(stderr, "n"
  639. "InnoDB: but index has only %lu fieldsn"
  640. "InnoDB: Submit a detailed bug report to http://bugs.mysql.comn"
  641. "InnoDB: Run also CHECK TABLE ",
  642. (ulong) dict_index_get_n_fields(index));
  643. ut_print_name(stderr, trx, index->table_name);
  644. fprintf(stderr, "n"
  645. "InnoDB: n_fields = %lu, i = %lu, ptr %pn",
  646. (ulong) n_fields, (ulong) i, ptr);
  647. return(NULL);
  648. }
  649. ptr = trx_undo_rec_get_col_val(ptr, &field, &len);
  650. upd_field = upd_get_nth_field(update, i);
  651. upd_field_set_field_no(upd_field, field_no, index, trx);
  652. if (len != UNIV_SQL_NULL && len >= UNIV_EXTERN_STORAGE_FIELD) {
  653. upd_field->extern_storage = TRUE;
  654. len -= UNIV_EXTERN_STORAGE_FIELD;
  655. }
  656. dfield_set_data(&(upd_field->new_val), field, len);
  657. }
  658. *upd = update;
  659. return(ptr);
  660. }
  661. /***********************************************************************
  662. Builds a partial row from an update undo log record. It contains the
  663. columns which occur as ordering in any index of the table. */
  664. byte*
  665. trx_undo_rec_get_partial_row(
  666. /*=========================*/
  667. /* out: pointer to remaining part of undo
  668. record */
  669. byte* ptr, /* in: remaining part in update undo log
  670. record of a suitable type, at the start of
  671. the stored index columns;
  672. NOTE that this copy of the undo log record must
  673. be preserved as long as the partial row is
  674. used, as we do NOT copy the data in the
  675. record! */
  676. dict_index_t* index, /* in: clustered index */
  677. dtuple_t** row, /* out, own: partial row */
  678. mem_heap_t* heap) /* in: memory heap from which the memory
  679. needed is allocated */
  680. {
  681. dfield_t* dfield;
  682. byte* field;
  683. ulint len;
  684. ulint field_no;
  685. ulint col_no;
  686. ulint row_len;
  687. ulint total_len;
  688. byte* start_ptr;
  689. ulint i;
  690. ut_ad(index && ptr && row && heap);
  691. row_len = dict_table_get_n_cols(index->table);
  692. *row = dtuple_create(heap, row_len);
  693. dict_table_copy_types(*row, index->table);
  694. start_ptr = ptr;
  695. total_len = mach_read_from_2(ptr);
  696. ptr += 2;
  697. for (i = 0;; i++) {
  698. if (ptr == start_ptr + total_len) {
  699. break;
  700. }
  701. ptr = trx_undo_update_rec_get_field_no(ptr, &field_no);
  702. col_no = dict_index_get_nth_col_no(index, field_no);
  703. ptr = trx_undo_rec_get_col_val(ptr, &field, &len);
  704. dfield = dtuple_get_nth_field(*row, col_no);
  705. dfield_set_data(dfield, field, len);
  706. }
  707. return(ptr);
  708. }
  709. /***************************************************************************
  710. Erases the unused undo log page end. */
  711. static
  712. void
  713. trx_undo_erase_page_end(
  714. /*====================*/
  715. page_t* undo_page, /* in: undo page whose end to erase */
  716. mtr_t* mtr) /* in: mtr */
  717. {
  718. ulint first_free;
  719. ulint i;
  720. first_free = mach_read_from_2(undo_page + TRX_UNDO_PAGE_HDR
  721. + TRX_UNDO_PAGE_FREE);
  722. for (i = first_free; i < UNIV_PAGE_SIZE - FIL_PAGE_DATA_END; i++) {
  723. undo_page[i] = 0xFF;
  724. }
  725. mlog_write_initial_log_record(undo_page, MLOG_UNDO_ERASE_END, mtr);
  726. }
  727. /***************************************************************
  728. Parses a redo log record of erasing of an undo page end. */
  729. byte*
  730. trx_undo_parse_erase_page_end(
  731. /*==========================*/
  732. /* out: end of log record or NULL */
  733. byte* ptr, /* in: buffer */
  734. byte* end_ptr __attribute__((unused)), /* in: buffer end */
  735. page_t* page, /* in: page or NULL */
  736. mtr_t* mtr) /* in: mtr or NULL */
  737. {
  738. ut_ad(ptr && end_ptr);
  739. if (page == NULL) {
  740. return(ptr);
  741. }
  742. trx_undo_erase_page_end(page, mtr);
  743. return(ptr);
  744. }
  745. /***************************************************************************
  746. Writes information to an undo log about an insert, update, or a delete marking
  747. of a clustered index record. This information is used in a rollback of the
  748. transaction and in consistent reads that must look to the history of this
  749. transaction. */
  750. ulint
  751. trx_undo_report_row_operation(
  752. /*==========================*/
  753. /* out: DB_SUCCESS or error code */
  754. ulint flags, /* in: if BTR_NO_UNDO_LOG_FLAG bit is
  755. set, does nothing */
  756. ulint op_type, /* in: TRX_UNDO_INSERT_OP or
  757. TRX_UNDO_MODIFY_OP */
  758. que_thr_t* thr, /* in: query thread */
  759. dict_index_t* index, /* in: clustered index */
  760. dtuple_t* clust_entry, /* in: in the case of an insert,
  761. index entry to insert into the
  762. clustered index, otherwise NULL */
  763. upd_t* update, /* in: in the case of an update,
  764. the update vector, otherwise NULL */
  765. ulint cmpl_info, /* in: compiler info on secondary
  766. index updates */
  767. rec_t* rec, /* in: in case of an update or delete
  768. marking, the record in the clustered
  769. index, otherwise NULL */
  770. dulint* roll_ptr) /* out: rollback pointer to the
  771. inserted undo log record,
  772. ut_dulint_zero if BTR_NO_UNDO_LOG
  773. flag was specified */
  774. {
  775. trx_t* trx;
  776. trx_undo_t* undo;
  777. page_t* undo_page;
  778. ulint offset;
  779. ulint page_no;
  780. ibool is_insert;
  781. trx_rseg_t* rseg;
  782. mtr_t mtr;
  783. ut_a(index->type & DICT_CLUSTERED);
  784. if (flags & BTR_NO_UNDO_LOG_FLAG) {
  785. *roll_ptr = ut_dulint_zero;
  786. return(DB_SUCCESS);
  787. }
  788. ut_ad(thr);
  789. ut_a(index->type & DICT_CLUSTERED);
  790. ut_ad((op_type != TRX_UNDO_INSERT_OP)
  791.       || (clust_entry && !update && !rec));
  792. trx = thr_get_trx(thr);
  793. rseg = trx->rseg;
  794. mutex_enter(&(trx->undo_mutex));
  795. /* If the undo log is not assigned yet, assign one */
  796. if (op_type == TRX_UNDO_INSERT_OP) {
  797. if (trx->insert_undo == NULL) {
  798. trx_undo_assign_undo(trx, TRX_UNDO_INSERT);
  799. }
  800. undo = trx->insert_undo;
  801. is_insert = TRUE;
  802. } else {
  803. ut_ad(op_type == TRX_UNDO_MODIFY_OP);
  804. if (trx->update_undo == NULL) {
  805. trx_undo_assign_undo(trx, TRX_UNDO_UPDATE);
  806. }
  807. undo = trx->update_undo;
  808. is_insert = FALSE;
  809. }
  810. if (undo == NULL) {
  811. /* Did not succeed: out of space */
  812. mutex_exit(&(trx->undo_mutex));
  813. return(DB_OUT_OF_FILE_SPACE);
  814. }
  815. page_no = undo->last_page_no;
  816. mtr_start(&mtr);
  817. for (;;) {
  818. undo_page = buf_page_get_gen(undo->space, page_no,
  819. RW_X_LATCH, undo->guess_page,
  820. BUF_GET,
  821. __FILE__, __LINE__,
  822. &mtr);
  823. #ifdef UNIV_SYNC_DEBUG
  824. buf_page_dbg_add_level(undo_page, SYNC_TRX_UNDO_PAGE);
  825. #endif /* UNIV_SYNC_DEBUG */
  826. if (op_type == TRX_UNDO_INSERT_OP) {
  827. offset = trx_undo_page_report_insert(undo_page, trx,
  828. index, clust_entry,
  829. &mtr);
  830. } else {
  831. offset = trx_undo_page_report_modify(undo_page, trx,
  832. index, rec, update,
  833. cmpl_info, &mtr);
  834. }
  835. if (offset == 0) {
  836. /* The record did not fit on the page. We erase the
  837. end segment of the undo log page and write a log
  838. record of it: this is to ensure that in the debug
  839. version the replicate page constructed using the log
  840. records stays identical to the original page */
  841. trx_undo_erase_page_end(undo_page, &mtr);
  842. }
  843. mtr_commit(&mtr);
  844. if (offset != 0) {
  845. /* Success */
  846. break;
  847. }
  848. ut_ad(page_no == undo->last_page_no);
  849. /* We have to extend the undo log by one page */
  850. mtr_start(&mtr);
  851. /* When we add a page to an undo log, this is analogous to
  852. a pessimistic insert in a B-tree, and we must reserve the
  853. counterpart of the tree latch, which is the rseg mutex. */
  854. mutex_enter(&(rseg->mutex));
  855. page_no = trx_undo_add_page(trx, undo, &mtr);
  856. mutex_exit(&(rseg->mutex));
  857. if (page_no == FIL_NULL) {
  858. /* Did not succeed: out of space */
  859. mutex_exit(&(trx->undo_mutex));
  860. mtr_commit(&mtr);
  861. return(DB_OUT_OF_FILE_SPACE);
  862. }
  863. }
  864. undo->empty = FALSE;
  865. undo->top_page_no = page_no;
  866. undo->top_offset  = offset;
  867. undo->top_undo_no = trx->undo_no;
  868. undo->guess_page = undo_page;
  869. UT_DULINT_INC(trx->undo_no);
  870. mutex_exit(&(trx->undo_mutex));
  871. *roll_ptr = trx_undo_build_roll_ptr(is_insert, rseg->id, page_no,
  872. offset);
  873. return(DB_SUCCESS);
  874. }
  875. /*============== BUILDING PREVIOUS VERSION OF A RECORD ===============*/
  876. /**********************************************************************
  877. Copies an undo record to heap. This function can be called if we know that
  878. the undo log record exists. */
  879. trx_undo_rec_t*
  880. trx_undo_get_undo_rec_low(
  881. /*======================*/
  882. /* out, own: copy of the record */
  883. dulint roll_ptr, /* in: roll pointer to record */
  884. mem_heap_t* heap) /* in: memory heap where copied */
  885. {
  886. trx_undo_rec_t* undo_rec;
  887. ulint rseg_id;
  888. ulint page_no;
  889. ulint offset;
  890. page_t* undo_page;
  891. trx_rseg_t* rseg;
  892. ibool is_insert;
  893. mtr_t mtr;
  894. trx_undo_decode_roll_ptr(roll_ptr, &is_insert, &rseg_id, &page_no,
  895. &offset);
  896. rseg = trx_rseg_get_on_id(rseg_id);
  897. mtr_start(&mtr);
  898. undo_page = trx_undo_page_get_s_latched(rseg->space, page_no, &mtr);
  899. undo_rec = trx_undo_rec_copy(undo_page + offset, heap);
  900. mtr_commit(&mtr);
  901. return(undo_rec);
  902. }
  903. /**********************************************************************
  904. Copies an undo record to heap. */
  905. ulint
  906. trx_undo_get_undo_rec(
  907. /*==================*/
  908. /* out: DB_SUCCESS, or
  909. DB_MISSING_HISTORY if the undo log
  910. has been truncated and we cannot
  911. fetch the old version; NOTE: the
  912. caller must have latches on the
  913. clustered index page and purge_view */
  914. dulint roll_ptr, /* in: roll pointer to record */
  915. dulint trx_id, /* in: id of the trx that generated
  916. the roll pointer: it points to an
  917. undo log of this transaction */
  918. trx_undo_rec_t** undo_rec, /* out, own: copy of the record */
  919. mem_heap_t* heap) /* in: memory heap where copied */
  920. {
  921. #ifdef UNIV_SYNC_DEBUG
  922. ut_ad(rw_lock_own(&(purge_sys->latch), RW_LOCK_SHARED));
  923. #endif /* UNIV_SYNC_DEBUG */
  924. if (!trx_purge_update_undo_must_exist(trx_id)) {
  925.      /* It may be that the necessary undo log has already been
  926. deleted */
  927. return(DB_MISSING_HISTORY);
  928. }
  929. *undo_rec = trx_undo_get_undo_rec_low(roll_ptr, heap);
  930. return(DB_SUCCESS);
  931. }
  932. /***********************************************************************
  933. Build a previous version of a clustered index record. This function checks
  934. that the caller has a latch on the index page of the clustered index record
  935. and an s-latch on the purge_view. This guarantees that the stack of versions
  936. is locked. */
  937. ulint
  938. trx_undo_prev_version_build(
  939. /*========================*/
  940. /* out: DB_SUCCESS, or DB_MISSING_HISTORY if
  941. the previous version is not >= purge_view,
  942. which means that it may have been removed,
  943. DB_ERROR if corrupted record */
  944. rec_t* index_rec,/* in: clustered index record in the
  945. index tree */
  946. mtr_t* index_mtr __attribute__((unused)),
  947.                                 /* in: mtr which contains the latch to
  948. index_rec page and purge_view */
  949. rec_t* rec, /* in: version of a clustered index record */
  950. dict_index_t* index, /* in: clustered index */
  951. mem_heap_t* heap, /* in: memory heap from which the memory
  952. needed is allocated */
  953. rec_t** old_vers)/* out, own: previous version, or NULL if
  954. rec is the first inserted version, or if
  955. history data has been deleted */
  956. {
  957. trx_undo_rec_t* undo_rec;
  958. dtuple_t* entry;
  959. dulint rec_trx_id;
  960. ulint type;
  961. dulint undo_no;
  962. dulint table_id;
  963. dulint trx_id;
  964. dulint roll_ptr;
  965. dulint old_roll_ptr;
  966. upd_t* update;
  967. byte* ptr;
  968. ulint info_bits;
  969. ulint cmpl_info;
  970. ibool dummy_extern;
  971. byte* buf;
  972. ulint err;
  973. #ifdef UNIV_SYNC_DEBUG
  974. ut_ad(rw_lock_own(&(purge_sys->latch), RW_LOCK_SHARED));
  975. #endif /* UNIV_SYNC_DEBUG */
  976. ut_ad(mtr_memo_contains(index_mtr, buf_block_align(index_rec), 
  977. MTR_MEMO_PAGE_S_FIX) ||
  978.       mtr_memo_contains(index_mtr, buf_block_align(index_rec), 
  979. MTR_MEMO_PAGE_X_FIX));
  980. if (!(index->type & DICT_CLUSTERED)) {
  981. fprintf(stderr, "InnoDB: Error: trying to access"
  982. " update undo rec for non-clustered index %sn"
  983. "InnoDB: Submit a detailed bug report to"
  984. " http://bugs.mysql.comn"
  985. "InnoDB: index record ", index->name);
  986. rec_print(stderr, index_rec);
  987. fputs("n"
  988. "InnoDB: record version ", stderr);
  989. rec_print(stderr, rec);
  990. putc('n', stderr);
  991.     return(DB_ERROR);
  992.     }
  993. roll_ptr = row_get_rec_roll_ptr(rec, index);
  994. old_roll_ptr = roll_ptr;
  995. *old_vers = NULL;
  996. if (trx_undo_roll_ptr_is_insert(roll_ptr)) {
  997. /* The record rec is the first inserted version */
  998. return(DB_SUCCESS);
  999. }
  1000.   rec_trx_id = row_get_rec_trx_id(rec, index);
  1001. err = trx_undo_get_undo_rec(roll_ptr, rec_trx_id, &undo_rec, heap);
  1002. if (err != DB_SUCCESS) {
  1003. return(err);
  1004. }
  1005. ptr = trx_undo_rec_get_pars(undo_rec, &type, &cmpl_info,
  1006. &dummy_extern, &undo_no, &table_id);
  1007. ptr = trx_undo_update_rec_get_sys_cols(ptr, &trx_id, &roll_ptr,
  1008. &info_bits);
  1009. ptr = trx_undo_rec_skip_row_ref(ptr, index);
  1010. ptr = trx_undo_update_rec_get_update(ptr, index, type, trx_id,
  1011. roll_ptr, info_bits, NULL, heap, &update);
  1012. if (ut_dulint_cmp(table_id, index->table->id) != 0) {
  1013. ptr = NULL;
  1014. fprintf(stderr,
  1015. "InnoDB: Error: trying to access update undo rec for table %sn"
  1016. "InnoDB: but the table id in the undo record is wrongn"
  1017. "InnoDB: Submit a detailed bug report to http://bugs.mysql.comn"
  1018. "InnoDB: Run also CHECK TABLE %sn",
  1019. index->table_name, index->table_name);
  1020. }
  1021. if (ptr == NULL) {
  1022. /* The record was corrupted, return an error; these printfs
  1023. should catch an elusive bug in row_vers_old_has_index_entry */
  1024. fprintf(stderr,
  1025. "InnoDB: table %s, index %s, n_uniq %lun"
  1026. "InnoDB: undo rec address %p, type %lu cmpl_info %lun"
  1027. "InnoDB: undo rec table id %lu %lu, index table id %lu %lun"
  1028. "InnoDB: dump of 150 bytes in undo rec: ",
  1029. index->table_name, index->name,
  1030. (ulong) dict_index_get_n_unique(index),
  1031. undo_rec, (ulong) type, (ulong) cmpl_info,
  1032. (ulong) ut_dulint_get_high(table_id),
  1033. (ulong) ut_dulint_get_low(table_id),
  1034. (ulong) ut_dulint_get_high(index->table->id),
  1035. (ulong) ut_dulint_get_low(index->table->id));
  1036. ut_print_buf(stderr, undo_rec, 150);
  1037. fputs("n"
  1038. "InnoDB: index record ", stderr);
  1039. rec_print(stderr, index_rec);
  1040. fputs("n"
  1041. "InnoDB: record version ", stderr);
  1042. rec_print(stderr, rec);
  1043. fprintf(stderr, "n"
  1044. "InnoDB: Record trx id %lu %lu, update rec trx id %lu %lun"
  1045. "InnoDB: Roll ptr in rec %lu %lu, in update rec %lu %lun",
  1046.   (ulong) ut_dulint_get_high(rec_trx_id),
  1047.   (ulong) ut_dulint_get_low(rec_trx_id),
  1048.   (ulong) ut_dulint_get_high(trx_id),
  1049.   (ulong) ut_dulint_get_low(trx_id),
  1050.   (ulong) ut_dulint_get_high(old_roll_ptr),
  1051.   (ulong) ut_dulint_get_low(old_roll_ptr),
  1052.   (ulong) ut_dulint_get_high(roll_ptr),
  1053.   (ulong) ut_dulint_get_low(roll_ptr));
  1054.  
  1055. trx_purge_sys_print();
  1056.  
  1057. return(DB_ERROR);
  1058. }
  1059. if (row_upd_changes_field_size_or_external(rec, index, update)) {
  1060. ulint* ext_vect;
  1061. ulint n_ext_vect;
  1062. /* We have to set the appropriate extern storage bits in the
  1063. old version of the record: the extern bits in rec for those
  1064. fields that update does NOT update, as well as the the bits for
  1065. those fields that update updates to become externally stored
  1066. fields. Store the info to ext_vect: */
  1067. ext_vect = mem_alloc(sizeof(ulint) * rec_get_n_fields(rec));
  1068. n_ext_vect = btr_push_update_extern_fields(ext_vect, rec,
  1069. update);
  1070. entry = row_rec_to_index_entry(ROW_COPY_DATA, index, rec,
  1071.      heap);
  1072. row_upd_index_replace_new_col_vals(entry, index, update, heap);
  1073. buf = mem_heap_alloc(heap, rec_get_converted_size(entry));
  1074. *old_vers = rec_convert_dtuple_to_rec(buf, entry);
  1075. /* Now set the extern bits in the old version of the record */
  1076. rec_set_field_extern_bits(*old_vers, ext_vect, n_ext_vect,
  1077. NULL);
  1078. mem_free(ext_vect);
  1079. } else {
  1080. buf = mem_heap_alloc(heap, rec_get_size(rec));
  1081. *old_vers = rec_copy(buf, rec);
  1082. row_upd_rec_in_place(*old_vers, update);
  1083. }
  1084. return(DB_SUCCESS);
  1085. }