row0upd.c
上传用户:tsgydb
上传日期:2007-04-14
资源大小:10674k
文件大小:34k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /******************************************************
  2. Update of a row
  3. (c) 1996 Innobase Oy
  4. Created 12/27/1996 Heikki Tuuri
  5. *******************************************************/
  6. #include "row0upd.h"
  7. #ifdef UNIV_NONINL
  8. #include "row0upd.ic"
  9. #endif
  10. #include "dict0dict.h"
  11. #include "dict0boot.h"
  12. #include "dict0crea.h"
  13. #include "mach0data.h"
  14. #include "trx0undo.h"
  15. #include "btr0btr.h"
  16. #include "btr0cur.h"
  17. #include "que0que.h"
  18. #include "row0ins.h"
  19. #include "row0sel.h"
  20. #include "row0row.h"
  21. #include "rem0cmp.h"
  22. #include "lock0lock.h"
  23. #include "log0log.h"
  24. #include "pars0sym.h"
  25. #include "eval0eval.h"
  26. /* What kind of latch and lock can we assume when the control comes to
  27.    -------------------------------------------------------------------
  28. an update node?
  29. --------------
  30. Efficiency of massive updates would require keeping an x-latch on a
  31. clustered index page through many updates, and not setting an explicit
  32. x-lock on clustered index records, as they anyway will get an implicit
  33. x-lock when they are updated. A problem is that the read nodes in the
  34. graph should know that they must keep the latch when passing the control
  35. up to the update node, and not set any record lock on the record which
  36. will be updated. Another problem occurs if the execution is stopped,
  37. as the kernel switches to another query thread, or the transaction must
  38. wait for a lock. Then we should be able to release the latch and, maybe,
  39. acquire an explicit x-lock on the record.
  40. Because this seems too complicated, we conclude that the less
  41. efficient solution of releasing all the latches when the control is
  42. transferred to another node, and acquiring explicit x-locks, is better. */
  43. /* How is a delete performed? If there is a delete without an
  44. explicit cursor, i.e., a searched delete, there are at least
  45. two different situations:
  46. the implicit select cursor may run on (1) the clustered index or
  47. on (2) a secondary index. The delete is performed by setting
  48. the delete bit in the record and substituting the id of the
  49. deleting transaction for the original trx id, and substituting a
  50. new roll ptr for previous roll ptr. The old trx id and roll ptr
  51. are saved in the undo log record. Thus, no physical changes occur
  52. in the index tree structure at the time of the delete. Only
  53. when the undo log is purged, the index records will be physically
  54. deleted from the index trees.
  55. The query graph executing a searched delete would consist of
  56. a delete node which has as a subtree a select subgraph.
  57. The select subgraph should return a (persistent) cursor
  58. in the clustered index, placed on page which is x-latched.
  59. The delete node should look for all secondary index records for
  60. this clustered index entry and mark them as deleted. When is
  61. the x-latch freed? The most efficient way for performing a
  62. searched delete is obviously to keep the x-latch for several
  63. steps of query graph execution. */
  64. /*************************************************************************
  65. Creates an update node for a query graph. */
  66. upd_node_t*
  67. upd_node_create(
  68. /*============*/
  69. /* out, own: update node */
  70. mem_heap_t* heap) /* in: mem heap where created */
  71. {
  72. upd_node_t* node;
  73. node = mem_heap_alloc(heap, sizeof(upd_node_t));
  74. node->common.type = QUE_NODE_UPDATE;
  75. node->state = UPD_NODE_UPDATE_CLUSTERED;
  76. node->select_will_do_update = FALSE;
  77. node->in_mysql_interface = FALSE;
  78. node->row = NULL;
  79. node->index = NULL;
  80. node->select = NULL;
  81. node->heap = mem_heap_create(128);
  82. node->magic_n = UPD_NODE_MAGIC_N;
  83. node->cmpl_info = 0;
  84. return(node);
  85. }
  86. /*************************************************************************
  87. Updates the trx id and roll ptr field in a clustered index record in database
  88. recovery. */
  89. void
  90. row_upd_rec_sys_fields_in_recovery(
  91. /*===============================*/
  92. rec_t* rec, /* in: record */
  93. ulint pos, /* in: TRX_ID position in rec */
  94. dulint trx_id, /* in: transaction id */
  95. dulint roll_ptr)/* in: roll ptr of the undo log record */
  96. {
  97. byte* field;
  98. ulint len;
  99. field = rec_get_nth_field(rec, pos, &len);
  100. ut_ad(len == DATA_TRX_ID_LEN);
  101. trx_write_trx_id(field, trx_id);
  102. field = rec_get_nth_field(rec, pos + 1, &len);
  103. ut_ad(len == DATA_ROLL_PTR_LEN);
  104. trx_write_roll_ptr(field, roll_ptr);
  105. }
  106. /*************************************************************************
  107. Sets the trx id or roll ptr field of a clustered index entry. */
  108. void
  109. row_upd_index_entry_sys_field(
  110. /*==========================*/
  111. dtuple_t* entry, /* in: index entry, where the memory buffers
  112. for sys fields are already allocated:
  113. the function just copies the new values to
  114. them */
  115. dict_index_t* index, /* in: clustered index */
  116. ulint type, /* in: DATA_TRX_ID or DATA_ROLL_PTR */
  117. dulint val) /* in: value to write */
  118. {
  119. dfield_t* dfield;
  120. byte* field;
  121. ulint pos;
  122. ut_ad(index->type & DICT_CLUSTERED);
  123. pos = dict_index_get_sys_col_pos(index, type);
  124. dfield = dtuple_get_nth_field(entry, pos);
  125. field = dfield_get_data(dfield);
  126. if (type == DATA_TRX_ID) {
  127. trx_write_trx_id(field, val);
  128. } else {
  129. ut_ad(type == DATA_ROLL_PTR);
  130. trx_write_roll_ptr(field, val);
  131. }
  132. }
  133. /***************************************************************
  134. Returns TRUE if row update changes size of some field in index. */
  135. ibool
  136. row_upd_changes_field_size(
  137. /*=======================*/
  138. /* out: TRUE if the update changes the size of
  139. some field in index */
  140. rec_t* rec, /* in: record in clustered index */
  141. dict_index_t* index, /* in: clustered index */
  142. upd_t* update) /* in: update vector */
  143. {
  144. upd_field_t* upd_field;
  145. dfield_t* new_val;
  146. ulint old_len;
  147. ulint new_len;
  148. ulint n_fields;
  149. ulint i;
  150. ut_ad(index->type & DICT_CLUSTERED);
  151. n_fields = upd_get_n_fields(update);
  152. for (i = 0; i < n_fields; i++) {
  153. upd_field = upd_get_nth_field(update, i);
  154. new_val = &(upd_field->new_val);
  155. new_len = new_val->len;
  156. if (new_len == UNIV_SQL_NULL) {
  157. new_len = dtype_get_sql_null_size(
  158. dict_index_get_nth_type(index, i));
  159. }
  160. old_len = rec_get_nth_field_size(rec, upd_field->field_no);
  161. if (old_len != new_len) {
  162. return(TRUE);
  163. }
  164. }
  165. return(FALSE);
  166. }
  167. /***************************************************************
  168. Replaces the new column values stored in the update vector to the record
  169. given. No field size changes are allowed. This function is used only for
  170. a clustered index */
  171. void
  172. row_upd_rec_in_place(
  173. /*=================*/
  174. rec_t* rec, /* in/out: record where replaced */
  175. upd_t* update) /* in: update vector */
  176. {
  177. upd_field_t* upd_field;
  178. dfield_t* new_val;
  179. ulint n_fields;
  180. ulint i;
  181. rec_set_info_bits(rec, update->info_bits);
  182. n_fields = upd_get_n_fields(update);
  183. for (i = 0; i < n_fields; i++) {
  184. upd_field = upd_get_nth_field(update, i);
  185. new_val = &(upd_field->new_val);
  186. rec_set_nth_field(rec, upd_field->field_no,
  187. dfield_get_data(new_val),
  188. dfield_get_len(new_val));
  189. }
  190. }
  191. /*************************************************************************
  192. Writes into the redo log the values of trx id and roll ptr and enough info
  193. to determine their positions within a clustered index record. */
  194. byte*
  195. row_upd_write_sys_vals_to_log(
  196. /*==========================*/
  197. /* out: new pointer to mlog */
  198. dict_index_t* index, /* in: clustered index */
  199. trx_t* trx, /* in: transaction */
  200. dulint roll_ptr,/* in: roll ptr of the undo log record */
  201. byte* log_ptr,/* pointer to a buffer of size > 20 opened
  202. in mlog */
  203. mtr_t* mtr) /* in: mtr */
  204. {
  205. ut_ad(index->type & DICT_CLUSTERED);
  206. ut_ad(mtr);
  207. log_ptr += mach_write_compressed(log_ptr,
  208. dict_index_get_sys_col_pos(index, DATA_TRX_ID));
  209. trx_write_roll_ptr(log_ptr, roll_ptr);
  210. log_ptr += DATA_ROLL_PTR_LEN;
  211. log_ptr += mach_dulint_write_compressed(log_ptr, trx->id);
  212. return(log_ptr);
  213. }
  214. /*************************************************************************
  215. Parses the log data of system field values. */
  216. byte*
  217. row_upd_parse_sys_vals(
  218. /*===================*/
  219. /* out: log data end or NULL */
  220. byte* ptr, /* in: buffer */
  221. byte* end_ptr,/* in: buffer end */
  222. ulint* pos, /* out: TRX_ID position in record */
  223. dulint* trx_id, /* out: trx id */
  224. dulint* roll_ptr)/* out: roll ptr */
  225. {
  226. ptr = mach_parse_compressed(ptr, end_ptr, pos);
  227. if (ptr == NULL) {
  228. return(NULL);
  229. }
  230. if (end_ptr < ptr + DATA_ROLL_PTR_LEN) {
  231. return(NULL);
  232. }
  233. *roll_ptr = trx_read_roll_ptr(ptr);
  234. ptr += DATA_ROLL_PTR_LEN;
  235. ptr = mach_dulint_parse_compressed(ptr, end_ptr, trx_id);
  236. return(ptr);
  237. }
  238. /***************************************************************
  239. Writes to the redo log the new values of the fields occurring in the index. */
  240. void
  241. row_upd_index_write_log(
  242. /*====================*/
  243. upd_t* update, /* in: update vector */
  244. byte* log_ptr,/* in: pointer to mlog buffer: must contain at least
  245. MLOG_BUF_MARGIN bytes of free space; the buffer is
  246. closed within this function */
  247. mtr_t* mtr) /* in: mtr into whose log to write */
  248. {
  249. upd_field_t* upd_field;
  250. dfield_t* new_val;
  251. ulint len;
  252. ulint n_fields;
  253. byte* buf_end;
  254. ulint i;
  255. n_fields = upd_get_n_fields(update);
  256. buf_end = log_ptr + MLOG_BUF_MARGIN;
  257. mach_write_to_1(log_ptr, update->info_bits);
  258. log_ptr++;
  259. log_ptr += mach_write_compressed(log_ptr, n_fields);
  260. for (i = 0; i < n_fields; i++) {
  261. ut_ad(MLOG_BUF_MARGIN > 30);
  262. if (log_ptr + 30 > buf_end) {
  263. mlog_close(mtr, log_ptr);
  264. log_ptr = mlog_open(mtr, MLOG_BUF_MARGIN);
  265. buf_end = log_ptr + MLOG_BUF_MARGIN;
  266. }
  267. upd_field = upd_get_nth_field(update, i);
  268. new_val = &(upd_field->new_val);
  269. len = new_val->len;
  270. log_ptr += mach_write_compressed(log_ptr, upd_field->field_no);
  271. log_ptr += mach_write_compressed(log_ptr, len);
  272. if (len != UNIV_SQL_NULL) {
  273. if (log_ptr + len < buf_end) {
  274. ut_memcpy(log_ptr, new_val->data, len);
  275. log_ptr += len;
  276. } else {
  277. mlog_close(mtr, log_ptr);
  278. mlog_catenate_string(mtr, new_val->data, len);
  279. log_ptr = mlog_open(mtr, MLOG_BUF_MARGIN);
  280. buf_end = log_ptr + MLOG_BUF_MARGIN;
  281. }
  282. }
  283. }
  284. mlog_close(mtr, log_ptr);
  285. }
  286. /*************************************************************************
  287. Parses the log data written by row_upd_index_write_log. */
  288. byte*
  289. row_upd_index_parse(
  290. /*================*/
  291. /* out: log data end or NULL */
  292. byte* ptr, /* in: buffer */
  293. byte* end_ptr,/* in: buffer end */
  294. mem_heap_t* heap, /* in: memory heap where update vector is
  295. built */
  296. upd_t** update_out)/* out: update vector */
  297. {
  298. upd_t* update;
  299. upd_field_t* upd_field;
  300. dfield_t* new_val;
  301. ulint len;
  302. ulint n_fields;
  303. byte* buf;
  304. ulint info_bits;
  305. ulint i;
  306. if (end_ptr < ptr + 1) {
  307. return(NULL);
  308. }
  309. info_bits = mach_read_from_1(ptr);
  310. ptr++;
  311. ptr = mach_parse_compressed(ptr, end_ptr, &n_fields);
  312. if (ptr == NULL) {
  313. return(NULL);
  314. }
  315. update = upd_create(n_fields, heap);
  316. update->info_bits = info_bits;
  317. for (i = 0; i < n_fields; i++) {
  318. upd_field = upd_get_nth_field(update, i);
  319. new_val = &(upd_field->new_val);
  320. ptr = mach_parse_compressed(ptr, end_ptr,
  321. &(upd_field->field_no));
  322. if (ptr == NULL) {
  323. return(NULL);
  324. }
  325. ptr = mach_parse_compressed(ptr, end_ptr, &len);
  326. if (ptr == NULL) {
  327. return(NULL);
  328. }
  329. new_val->len = len;
  330. if (len != UNIV_SQL_NULL) {
  331. if (end_ptr < ptr + len) {
  332. return(NULL);
  333. } else {
  334. buf = mem_heap_alloc(heap, len);
  335. ut_memcpy(buf, ptr, len);
  336. ptr += len;
  337. new_val->data = buf;
  338. }
  339. }
  340. }
  341. *update_out = update;
  342. return(ptr);
  343. }
  344. /*******************************************************************
  345. Builds an update vector from those fields, excluding the roll ptr and
  346. trx id fields, which in an index entry differ from a record that has
  347. the equal ordering fields. */
  348. upd_t*
  349. row_upd_build_difference(
  350. /*=====================*/
  351. /* out, own: update vector of differing
  352. fields, excluding roll ptr and trx id */
  353. dict_index_t* index, /* in: clustered index */
  354. dtuple_t* entry, /* in: entry to insert */
  355. rec_t* rec, /* in: clustered index record */
  356. mem_heap_t* heap) /* in: memory heap from which allocated */
  357. {
  358. upd_field_t* upd_field;
  359. dfield_t* dfield;
  360. byte* data;
  361. ulint len;
  362. upd_t* update;
  363. ulint n_diff;
  364. ulint roll_ptr_pos;
  365. ulint trx_id_pos;
  366. ulint i;
  367. /* This function is used only for a clustered index */
  368. ut_ad(index->type & DICT_CLUSTERED);
  369. update = upd_create(dtuple_get_n_fields(entry), heap);
  370. n_diff = 0;
  371. roll_ptr_pos = dict_index_get_sys_col_pos(index, DATA_ROLL_PTR);
  372. trx_id_pos = dict_index_get_sys_col_pos(index, DATA_TRX_ID);
  373. for (i = 0; i < dtuple_get_n_fields(entry); i++) {
  374. data = rec_get_nth_field(rec, i, &len);
  375. dfield = dtuple_get_nth_field(entry, i);
  376. if ((i != trx_id_pos) && (i != roll_ptr_pos)
  377.     && !dfield_data_is_equal(dfield, len, data)) {
  378. upd_field = upd_get_nth_field(update, n_diff);
  379. dfield_copy(&(upd_field->new_val), dfield);
  380. upd_field_set_field_no(upd_field, i, index);
  381. n_diff++;
  382. }
  383. }
  384. update->n_fields = n_diff;
  385. return(update);
  386. }
  387. /***************************************************************
  388. Replaces the new column values stored in the update vector to the index entry
  389. given. */
  390. void
  391. row_upd_index_replace_new_col_vals(
  392. /*===============================*/
  393. dtuple_t* entry, /* in/out: index entry where replaced */
  394. dict_index_t* index, /* in: index; NOTE that may also be a
  395. non-clustered index */
  396. upd_t* update) /* in: update vector */
  397. {
  398. upd_field_t* upd_field;
  399. dfield_t* dfield;
  400. dfield_t* new_val;
  401. ulint field_no;
  402. dict_index_t* clust_index;
  403. ulint i;
  404. ut_ad(index);
  405. clust_index = dict_table_get_first_index(index->table);
  406. dtuple_set_info_bits(entry, update->info_bits);
  407. for (i = 0; i < upd_get_n_fields(update); i++) {
  408. upd_field = upd_get_nth_field(update, i);
  409. field_no = dict_index_get_nth_col_pos(index,
  410. dict_index_get_nth_col_no(clust_index,
  411. upd_field->field_no));
  412. if (field_no != ULINT_UNDEFINED) {
  413. dfield = dtuple_get_nth_field(entry, field_no);
  414. new_val = &(upd_field->new_val);
  415. dfield_set_data(dfield, new_val->data, new_val->len);
  416. }
  417. }
  418. }
  419. /***************************************************************
  420. Replaces the new column values stored in the update vector to the
  421. clustered index entry given. */
  422. void
  423. row_upd_clust_index_replace_new_col_vals(
  424. /*=====================================*/
  425. dtuple_t* entry, /* in/out: index entry where replaced */
  426. upd_t* update) /* in: update vector */
  427. {
  428. upd_field_t* upd_field;
  429. dfield_t* dfield;
  430. dfield_t* new_val;
  431. ulint field_no;
  432. ulint i;
  433. dtuple_set_info_bits(entry, update->info_bits);
  434. for (i = 0; i < upd_get_n_fields(update); i++) {
  435. upd_field = upd_get_nth_field(update, i);
  436. field_no = upd_field->field_no;
  437. dfield = dtuple_get_nth_field(entry, field_no);
  438. new_val = &(upd_field->new_val);
  439. dfield_set_data(dfield, new_val->data, new_val->len);
  440. }
  441. }
  442. /***************************************************************
  443. Checks if an update vector changes an ordering field of an index record.
  444. This function is fast if the update vector is short or the number of ordering
  445. fields in the index is small. Otherwise, this can be quadratic. */
  446. ibool
  447. row_upd_changes_ord_field(
  448. /*======================*/
  449. /* out: TRUE if update vector changes
  450. an ordering field in the index record */
  451. dtuple_t* row, /* in: old value of row, or NULL if the
  452. row and the data values in update are not
  453. known when this function is called, e.g., at
  454. compile time */
  455. dict_index_t* index, /* in: index of the record */
  456. upd_t* update) /* in: update vector for the row */
  457. {
  458. upd_field_t* upd_field;
  459. dict_field_t* ind_field;
  460. dict_col_t* col;
  461. ulint n_unique;
  462. ulint n_upd_fields;
  463. ulint col_pos;
  464. ulint col_no;
  465. ulint i, j;
  466. ut_ad(update && index);
  467. n_unique = dict_index_get_n_unique(index);
  468. n_upd_fields = upd_get_n_fields(update);
  469. for (i = 0; i < n_unique; i++) {
  470. ind_field = dict_index_get_nth_field(index, i);
  471. col = dict_field_get_col(ind_field);
  472. col_pos = dict_col_get_clust_pos(col);
  473. col_no = dict_col_get_no(col);
  474. for (j = 0; j < n_upd_fields; j++) {
  475. upd_field = upd_get_nth_field(update, j);
  476. if (col_pos == upd_field->field_no
  477.      && (row == NULL
  478.  || !dfield_datas_are_equal(
  479. dtuple_get_nth_field(row, col_no),
  480. &(upd_field->new_val)))) {
  481. return(TRUE);
  482. }
  483. }
  484. }
  485. return(FALSE);
  486. }
  487. /***************************************************************
  488. Checks if an update vector changes an ordering field of an index record.
  489. This function is fast if the update vector is short or the number of ordering
  490. fields in the index is small. Otherwise, this can be quadratic. */
  491. ibool
  492. row_upd_changes_some_index_ord_field(
  493. /*=================================*/
  494. /* out: TRUE if update vector may change
  495. an ordering field in an index record */
  496. dict_table_t* table, /* in: table */
  497. upd_t* update) /* in: update vector for the row */
  498. {
  499. dict_index_t* index;
  500. index = dict_table_get_first_index(table);
  501. while (index) {
  502. if (row_upd_changes_ord_field(NULL, index, update)) {
  503. return(TRUE);
  504. }
  505. index = dict_table_get_next_index(index);
  506. }
  507. return(FALSE);
  508. }
  509. /*************************************************************************
  510. Copies the column values from a record. */
  511. UNIV_INLINE
  512. void
  513. row_upd_copy_columns(
  514. /*=================*/
  515. rec_t* rec, /* in: record in a clustered index */
  516. sym_node_t* column) /* in: first column in a column list, or
  517. NULL */
  518. {
  519. byte* data;
  520. ulint len;
  521. while (column) {
  522. data = rec_get_nth_field(rec,
  523. column->field_nos[SYM_CLUST_FIELD_NO],
  524. &len);
  525. eval_node_copy_and_alloc_val(column, data, len);
  526. column = UT_LIST_GET_NEXT(col_var_list, column);
  527. }
  528. }
  529. /*************************************************************************
  530. Calculates the new values for fields to update. Note that row_upd_copy_columns
  531. must have been called first. */
  532. UNIV_INLINE
  533. void
  534. row_upd_eval_new_vals(
  535. /*==================*/
  536. upd_t* update) /* in: update vector */
  537. {
  538. que_node_t* exp;
  539. upd_field_t* upd_field;
  540. ulint n_fields;
  541. ulint i;
  542. n_fields = upd_get_n_fields(update);
  543. for (i = 0; i < n_fields; i++) {
  544. upd_field = upd_get_nth_field(update, i);
  545. exp = upd_field->exp;
  546. eval_exp(exp);
  547. dfield_copy_data(&(upd_field->new_val), que_node_get_val(exp));
  548. }
  549. }
  550. /***************************************************************
  551. Stores to the heap the row on which the node->pcur is positioned. */
  552. UNIV_INLINE
  553. void
  554. row_upd_store_row(
  555. /*==============*/
  556. upd_node_t* node) /* in: row update node */
  557. {
  558. dict_index_t* clust_index;
  559. ut_ad((node->pcur)->latch_mode != BTR_NO_LATCHES);
  560. if (node->row != NULL) {
  561. mem_heap_empty(node->heap);
  562. node->row = NULL;
  563. }
  564. clust_index = dict_table_get_first_index(node->table);
  565. node->row = row_build(ROW_COPY_DATA, clust_index,
  566. btr_pcur_get_rec(node->pcur), node->heap);
  567. }
  568. /***************************************************************
  569. Updates a secondary index entry of a row. */
  570. static
  571. ulint
  572. row_upd_sec_index_entry(
  573. /*====================*/
  574. /* out: DB_SUCCESS if operation successfully
  575. completed, else error code or DB_LOCK_WAIT */
  576. upd_node_t* node, /* in: row update node */
  577. que_thr_t* thr) /* in: query thread */
  578. {
  579. ibool found;
  580. dict_index_t* index;
  581. dtuple_t* entry;
  582. mtr_t mtr;
  583. btr_pcur_t pcur;
  584. btr_cur_t* btr_cur;
  585. mem_heap_t* heap;
  586. rec_t* rec;
  587. ulint err = DB_SUCCESS;
  588. index = node->index;
  589. heap = mem_heap_create(1024);
  590. /* Build old index entry */
  591. entry = row_build_index_entry(node->row, index, heap);
  592. log_free_check();
  593. mtr_start(&mtr);
  594. found = row_search_index_entry(index, entry, BTR_MODIFY_LEAF, &pcur,
  595. &mtr);
  596. ut_ad(found);
  597. btr_cur = btr_pcur_get_btr_cur(&pcur);
  598. rec = btr_cur_get_rec(btr_cur);
  599.   /* Delete mark the old index record; it can already be delete marked if
  600.   we return after a lock wait in row_ins_index_entry below */
  601. if (!rec_get_deleted_flag(rec)) {
  602. err = btr_cur_del_mark_set_sec_rec(0, btr_cur, TRUE, thr,
  603. &mtr);
  604. }
  605. btr_pcur_close(&pcur);
  606. mtr_commit(&mtr);
  607. if (node->is_delete || err != DB_SUCCESS) {
  608. mem_heap_free(heap);
  609.          return(err);
  610. }
  611. /* Build a new index entry */
  612. row_upd_index_replace_new_col_vals(entry, index, node->update);
  613. /* Insert new index entry */
  614. err = row_ins_index_entry(index, entry, thr);
  615. mem_heap_free(heap);
  616.         return(err);
  617. }
  618. /***************************************************************
  619. Updates secondary index record if it is changed in the row update. This
  620. should be quite rare in database applications. */
  621. UNIV_INLINE
  622. ulint
  623. row_upd_sec_step(
  624. /*=============*/
  625. /* out: DB_SUCCESS if operation successfully
  626. completed, else error code or DB_LOCK_WAIT */
  627. upd_node_t* node, /* in: row update node */
  628. que_thr_t* thr) /* in: query thread */
  629. {
  630. ulint err;
  631. ut_ad((node->state == UPD_NODE_UPDATE_ALL_SEC)
  632. || (node->state == UPD_NODE_UPDATE_SOME_SEC));
  633. ut_ad(!(node->index->type & DICT_CLUSTERED));
  634. if ((node->state == UPD_NODE_UPDATE_ALL_SEC)
  635. || row_upd_changes_ord_field(node->row, node->index,
  636. node->update)) {
  637. err = row_upd_sec_index_entry(node, thr);
  638. return(err);
  639. }
  640. return(DB_SUCCESS);
  641. }
  642. /***************************************************************
  643. Marks the clustered index record deleted and inserts the updated version
  644. of the record to the index. This function should be used when the ordering
  645. fields of the clustered index record change. This should be quite rare in
  646. database applications. */
  647. static
  648. ulint
  649. row_upd_clust_rec_by_insert(
  650. /*========================*/
  651. /* out: DB_SUCCESS if operation successfully
  652. completed, else error code or DB_LOCK_WAIT */
  653. upd_node_t* node, /* in: row update node */
  654. dict_index_t* index, /* in: clustered index of the record */
  655. que_thr_t* thr, /* in: query thread */
  656. mtr_t* mtr) /* in: mtr; gets committed here */
  657. {
  658. btr_pcur_t* pcur;
  659. btr_cur_t* btr_cur;
  660. trx_t* trx;
  661. dict_table_t* table;
  662. mem_heap_t* heap;
  663. dtuple_t* entry;
  664. ulint err;
  665. ut_ad(node);
  666. ut_ad(index->type & DICT_CLUSTERED);
  667. trx = thr_get_trx(thr);
  668. table = node->table;
  669. pcur = node->pcur;
  670. btr_cur = btr_pcur_get_btr_cur(pcur);
  671. if (node->state != UPD_NODE_INSERT_CLUSTERED) {
  672. err = btr_cur_del_mark_set_clust_rec(BTR_NO_LOCKING_FLAG,
  673. btr_cur, TRUE, thr, mtr);
  674. if (err != DB_SUCCESS) {
  675. mtr_commit(mtr);
  676. return(err);
  677. }
  678. mtr_commit(mtr);
  679. node->state = UPD_NODE_INSERT_CLUSTERED;
  680. heap = mem_heap_create(1024);
  681. entry = row_build_index_entry(node->row, index, heap);
  682. row_upd_clust_index_replace_new_col_vals(entry, node->update);
  683. row_upd_index_entry_sys_field(entry, index, DATA_TRX_ID, trx->id);
  684. err = row_ins_index_entry(index, entry, thr);
  685. mem_heap_free(heap);
  686. return(err);
  687. }
  688. /***************************************************************
  689. Updates a clustered index record of a row when the ordering fields do
  690. not change. */
  691. static
  692. ulint
  693. row_upd_clust_rec(
  694. /*==============*/
  695. /* out: DB_SUCCESS if operation successfully
  696. completed, else error code or DB_LOCK_WAIT */
  697. upd_node_t* node, /* in: row update node */
  698. dict_index_t* index, /* in: clustered index */
  699. que_thr_t* thr, /* in: query thread */
  700. mtr_t* mtr) /* in: mtr; gets committed here */
  701. {
  702. btr_pcur_t* pcur;
  703. btr_cur_t* btr_cur;
  704. ulint err;
  705. ut_ad(node);
  706. ut_ad(index->type & DICT_CLUSTERED);
  707. pcur = node->pcur;
  708. btr_cur = btr_pcur_get_btr_cur(pcur);
  709. ut_ad(FALSE == rec_get_deleted_flag(btr_pcur_get_rec(pcur)));
  710. /* Try optimistic updating of the record, keeping changes within
  711. the page; we do not check locks because we assume the x-lock on the
  712. record to update */
  713. if (node->cmpl_info & UPD_NODE_NO_SIZE_CHANGE) {
  714. err = btr_cur_update_in_place(BTR_NO_LOCKING_FLAG,
  715. btr_cur, node->update,
  716. node->cmpl_info, thr, mtr);
  717. } else {
  718. err = btr_cur_optimistic_update(BTR_NO_LOCKING_FLAG,
  719. btr_cur, node->update,
  720. node->cmpl_info, thr, mtr);
  721. }
  722. mtr_commit(mtr);
  723. if (err == DB_SUCCESS) {
  724. return(err);
  725. }
  726. /* We may have to modify the tree structure: do a pessimistic descent
  727. down the index tree */
  728. mtr_start(mtr);
  729. /* NOTE: this transaction has an s-lock or x-lock on the record and
  730. therefore other transactions cannot modify the record when we have no
  731. latch on the page. In addition, we assume that other query threads of
  732. the same transaction do not modify the record in the meantime.
  733. Therefore we can assert that the restoration of the cursor succeeds. */
  734. ut_a(btr_pcur_restore_position(BTR_MODIFY_TREE, pcur, mtr));
  735. ut_ad(FALSE == rec_get_deleted_flag(btr_pcur_get_rec(pcur)));
  736. err = btr_cur_pessimistic_update(BTR_NO_LOCKING_FLAG, btr_cur,
  737. node->update, node->cmpl_info, thr, mtr);
  738. mtr_commit(mtr);
  739. return(err);
  740. }
  741. /***************************************************************
  742. Delete marks a clustered index record. */
  743. static
  744. ulint
  745. row_upd_del_mark_clust_rec(
  746. /*=======================*/
  747. /* out: DB_SUCCESS if operation successfully
  748. completed, else error code or DB_LOCK_WAIT */
  749. upd_node_t* node, /* in: row update node */
  750. dict_index_t* index, /* in: clustered index */
  751. que_thr_t* thr, /* in: query thread */
  752. mtr_t* mtr) /* in: mtr; gets committed here */
  753. {
  754. btr_pcur_t* pcur;
  755. btr_cur_t* btr_cur;
  756. ulint err;
  757. ut_ad(node);
  758. ut_ad(index->type & DICT_CLUSTERED);
  759. ut_ad(node->is_delete);
  760. pcur = node->pcur;
  761. btr_cur = btr_pcur_get_btr_cur(pcur);
  762. ut_ad(FALSE == rec_get_deleted_flag(btr_pcur_get_rec(pcur)));
  763. /* Store row because we have to build also the secondary index
  764. entries */
  765. row_upd_store_row(node);
  766. /* Mark the clustered index record deleted; we do not have to check
  767. locks, because we assume that we have an x-lock on the record */
  768. err = btr_cur_del_mark_set_clust_rec(BTR_NO_LOCKING_FLAG, btr_cur,
  769. TRUE, thr, mtr);
  770. mtr_commit(mtr);
  771. return(err);
  772. }
  773. /***************************************************************
  774. Updates the clustered index record. */
  775. static
  776. ulint
  777. row_upd_clust_step(
  778. /*===============*/
  779. /* out: DB_SUCCESS if operation successfully
  780. completed, DB_LOCK_WAIT in case of a lock wait,
  781. else error code */
  782. upd_node_t* node, /* in: row update node */
  783. que_thr_t* thr) /* in: query thread */
  784. {
  785. dict_index_t* index;
  786. btr_pcur_t* pcur;
  787. ibool success;
  788. ulint err;
  789. mtr_t mtr_buf;
  790. mtr_t* mtr;
  791. index = dict_table_get_first_index(node->table);
  792. pcur = node->pcur;
  793. /* We have to restore the cursor to its position */
  794. mtr = &mtr_buf;
  795. mtr_start(mtr);
  796. /* If the restoration does not succeed, then the same
  797. transaction has deleted the record on which the cursor was,
  798. and that is an SQL error. If the restoration succeeds, it may
  799. still be that the same transaction has successively deleted
  800. and inserted a record with the same ordering fields, but in
  801. that case we know that the transaction has at least an
  802. implicit x-lock on the record. */
  803. ut_a(pcur->rel_pos == BTR_PCUR_ON);
  804. success = btr_pcur_restore_position(BTR_MODIFY_LEAF, pcur, mtr);
  805. if (!success) {
  806. err = DB_RECORD_NOT_FOUND;
  807. mtr_commit(mtr);
  808. return(err);
  809. }
  810. /* If this is a row in SYS_INDEXES table of the data dictionary,
  811. then we have to free the file segments of the index tree associated
  812. with the index */
  813. if (ut_dulint_cmp(node->table->id, DICT_INDEXES_ID) == 0) {
  814. dict_drop_index_tree(btr_pcur_get_rec(pcur), mtr);
  815. mtr_commit(mtr);
  816. mtr_start(mtr);
  817. success = btr_pcur_restore_position(BTR_MODIFY_LEAF, pcur,
  818. mtr);
  819. if (!success) {
  820. err = DB_ERROR;
  821. mtr_commit(mtr);
  822. return(err);
  823. }
  824. if (!node->has_clust_rec_x_lock) {
  825. err = lock_clust_rec_modify_check_and_lock(0,
  826. btr_pcur_get_rec(pcur),
  827. index, thr);
  828. if (err != DB_SUCCESS) {
  829. mtr_commit(mtr);
  830. return(err);
  831. }
  832. }
  833. /* NOTE: the following function calls will also commit mtr */
  834. if (node->is_delete) {
  835. err = row_upd_del_mark_clust_rec(node, index, thr, mtr);
  836. if (err != DB_SUCCESS) {
  837. return(err);
  838. }
  839. node->state = UPD_NODE_UPDATE_ALL_SEC;
  840. node->index = dict_table_get_next_index(index);
  841. return(err);
  842. }
  843. /* If the update is made for MySQL, we already have the update vector
  844. ready, else we have to do some evaluation: */
  845.  
  846. if (!node->in_mysql_interface) {
  847. /* Copy the necessary columns from clust_rec and calculate the
  848. new values to set */
  849. row_upd_copy_columns(btr_pcur_get_rec(pcur),
  850. UT_LIST_GET_FIRST(node->columns));
  851. row_upd_eval_new_vals(node->update);
  852. }
  853. if (node->cmpl_info & UPD_NODE_NO_ORD_CHANGE) {
  854. err = row_upd_clust_rec(node, index, thr, mtr);
  855. return(err);
  856. }
  857. row_upd_store_row(node);
  858. if (row_upd_changes_ord_field(node->row, index, node->update)) {
  859. /* Update causes an ordering field (ordering fields within
  860. the B-tree) of the clustered index record to change: perform
  861. the update by delete marking and inserting.
  862. TODO! What to do to the 'Halloween problem', where an update
  863. moves the record forward in index so that it is again
  864. updated when the cursor arrives there? Solution: the
  865. read operation must check the undo record undo number when
  866. choosing records to update. MySQL solves now the problem
  867. externally! */
  868. err = row_upd_clust_rec_by_insert(node, index, thr, mtr);
  869. if (err != DB_SUCCESS) {
  870. return(err);
  871. }
  872. node->state = UPD_NODE_UPDATE_ALL_SEC;
  873. } else {
  874. err = row_upd_clust_rec(node, index, thr, mtr);
  875. if (err != DB_SUCCESS) {
  876. return(err);
  877. }
  878. node->state = UPD_NODE_UPDATE_SOME_SEC;
  879. }
  880. node->index = dict_table_get_next_index(index);
  881. return(err);
  882. }
  883. /***************************************************************
  884. Updates the affected index records of a row. When the control is transferred
  885. to this node, we assume that we have a persistent cursor which was on a
  886. record, and the position of the cursor is stored in the cursor. */
  887. static
  888. ulint
  889. row_upd(
  890. /*====*/
  891. /* out: DB_SUCCESS if operation successfully
  892. completed, else error code or DB_LOCK_WAIT */
  893. upd_node_t* node, /* in: row update node */
  894. que_thr_t* thr) /* in: query thread */
  895. {
  896. ulint err = DB_SUCCESS;
  897. ut_ad(node && thr);
  898. if (node->in_mysql_interface) {
  899. /* We do not get the cmpl_info value from the MySQL
  900. interpreter: we must calculate it on the fly: */
  901. if (row_upd_changes_some_index_ord_field(node->table,
  902. node->update)) {
  903. node->cmpl_info = 0; 
  904. } else {
  905. node->cmpl_info = UPD_NODE_NO_ORD_CHANGE;
  906. }
  907. }
  908. if (node->state == UPD_NODE_UPDATE_CLUSTERED
  909. || node->state == UPD_NODE_INSERT_CLUSTERED) {
  910. err = row_upd_clust_step(node, thr);
  911. if (err != DB_SUCCESS) {
  912. goto function_exit;
  913. }
  914. }
  915. if (!node->is_delete && (node->cmpl_info & UPD_NODE_NO_ORD_CHANGE)) {
  916. goto function_exit;
  917. }
  918. while (node->index != NULL) {
  919. err = row_upd_sec_step(node, thr);
  920. if (err != DB_SUCCESS) {
  921. goto function_exit;
  922. }
  923. node->index = dict_table_get_next_index(node->index);
  924.         }
  925. function_exit:
  926. if (err == DB_SUCCESS) {
  927. /* Do some cleanup */
  928. if (node->row != NULL) {
  929. mem_heap_empty(node->heap);
  930. node->row = NULL;
  931. }
  932. node->state = UPD_NODE_UPDATE_CLUSTERED;
  933. }
  934.         return(err);
  935. }
  936. /***************************************************************
  937. Updates a row in a table. This is a high-level function used in SQL execution
  938. graphs. */
  939. que_thr_t*
  940. row_upd_step(
  941. /*=========*/
  942. /* out: query thread to run next or NULL */
  943. que_thr_t* thr) /* in: query thread */
  944. {
  945. upd_node_t* node;
  946. sel_node_t* sel_node;
  947. que_node_t* parent;
  948. ulint err = DB_SUCCESS;
  949. trx_t* trx;
  950. ut_ad(thr);
  951. trx = thr_get_trx(thr);
  952. node = thr->run_node;
  953. sel_node = node->select;
  954. parent = que_node_get_parent(node);
  955. ut_ad(que_node_get_type(node) == QUE_NODE_UPDATE);
  956. if (thr->prev_node == parent) {
  957. node->state = UPD_NODE_SET_IX_LOCK;
  958. }
  959. if (node->state == UPD_NODE_SET_IX_LOCK) {
  960. if (!node->has_clust_rec_x_lock) {
  961. /* It may be that the current session has not yet
  962. started its transaction, or it has been committed: */
  963. trx_start_if_not_started(thr_get_trx(thr));
  964. err = lock_table(0, node->table, LOCK_IX, thr);
  965. if (err != DB_SUCCESS) {
  966. goto error_handling;
  967. }
  968. }
  969. node->state = UPD_NODE_UPDATE_CLUSTERED;
  970. if (node->searched_update) {
  971. /* Reset the cursor */
  972. sel_node->state = SEL_NODE_OPEN;
  973. /* Fetch a row to update */
  974. thr->run_node = sel_node;
  975. return(thr);
  976. }
  977. }
  978. /* sel_node is NULL if we are in the MySQL interface */
  979. if (sel_node && (sel_node->state != SEL_NODE_FETCH)) {
  980. if (!node->searched_update) {
  981. /* An explicit cursor should be positioned on a row
  982. to update */
  983. ut_error;
  984. err = DB_ERROR;
  985. goto error_handling;
  986. }
  987. ut_ad(sel_node->state == SEL_NODE_NO_MORE_ROWS);
  988. /* No more rows to update, or the select node performed the
  989. updates directly in-place */
  990. thr->run_node = parent;
  991. return(thr);
  992. }
  993. /* DO THE CHECKS OF THE CONSISTENCY CONSTRAINTS HERE */
  994. err = row_upd(node, thr);
  995. error_handling:
  996. trx->error_state = err;
  997. if (err == DB_SUCCESS) {
  998. /* Ok: do nothing */
  999. } else if (err == DB_LOCK_WAIT) {
  1000. return(NULL);
  1001. } else {
  1002. return(NULL);
  1003. }
  1004. /* DO THE TRIGGER ACTIONS HERE */
  1005. if (node->searched_update) {
  1006. /* Fetch next row to update */
  1007. thr->run_node = sel_node;
  1008. } else {
  1009. /* It was an explicit cursor update */
  1010. thr->run_node = parent;
  1011. }
  1012. node->state = UPD_NODE_UPDATE_CLUSTERED;
  1013. return(thr);
  1014. /*************************************************************************
  1015. Performs an in-place update for the current clustered index record in
  1016. select. */
  1017. void
  1018. row_upd_in_place_in_select(
  1019. /*=======================*/
  1020. sel_node_t* sel_node, /* in: select node */
  1021. que_thr_t* thr, /* in: query thread */
  1022. mtr_t* mtr) /* in: mtr */
  1023. {
  1024. upd_node_t* node;
  1025. btr_pcur_t* pcur;
  1026. btr_cur_t* btr_cur;
  1027. ulint err;
  1028. ut_ad(sel_node->select_will_do_update);
  1029. ut_ad(sel_node->latch_mode == BTR_MODIFY_LEAF);
  1030. ut_ad(sel_node->asc);
  1031. node = que_node_get_parent(sel_node);
  1032. ut_ad(que_node_get_type(node) == QUE_NODE_UPDATE);
  1033. pcur = node->pcur;
  1034. btr_cur = btr_pcur_get_btr_cur(pcur);
  1035. /* Copy the necessary columns from clust_rec and calculate the new
  1036. values to set */
  1037. row_upd_copy_columns(btr_pcur_get_rec(pcur),
  1038. UT_LIST_GET_FIRST(node->columns));
  1039. row_upd_eval_new_vals(node->update);
  1040. ut_ad(FALSE == rec_get_deleted_flag(btr_pcur_get_rec(pcur)));
  1041. ut_ad(node->cmpl_info & UPD_NODE_NO_SIZE_CHANGE);
  1042. ut_ad(node->cmpl_info & UPD_NODE_NO_ORD_CHANGE);
  1043. ut_ad(node->select_will_do_update);
  1044. err = btr_cur_update_in_place(BTR_NO_LOCKING_FLAG, btr_cur,
  1045. node->update, node->cmpl_info,
  1046. thr, mtr);
  1047. ut_ad(err == DB_SUCCESS);
  1048. }