btr0btr.c
上传用户:tsgydb
上传日期:2007-04-14
资源大小:10674k
文件大小:63k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /******************************************************
  2. The B-tree
  3. (c) 1994-1996 Innobase Oy
  4. Created 6/2/1994 Heikki Tuuri
  5. *******************************************************/
  6. #include "btr0btr.h"
  7. #ifdef UNIV_NONINL
  8. #include "btr0btr.ic"
  9. #endif
  10. #include "fsp0fsp.h"
  11. #include "page0page.h"
  12. #include "btr0cur.h"
  13. #include "btr0sea.h"
  14. #include "btr0pcur.h"
  15. #include "rem0cmp.h"
  16. #include "lock0lock.h"
  17. #include "ibuf0ibuf.h"
  18. /*
  19. Node pointers
  20. -------------
  21. Leaf pages of a B-tree contain the index records stored in the
  22. tree. On levels n > 0 we store 'node pointers' to pages on level
  23. n - 1. For each page there is exactly one node pointer stored:
  24. thus the our tree is an ordinary B-tree, not a B-link tree.
  25. A node pointer contains a prefix P of an index record. The prefix
  26. is long enough so that it determines an index record uniquely.
  27. The file page number of the child page is added as the last
  28. field. To the child page we can store node pointers or index records
  29. which are >= P in the alphabetical order, but < P1 if there is
  30. a next node pointer on the level, and P1 is its prefix.
  31. If a node pointer with a prefix P points to a non-leaf child, 
  32. then the leftmost record in the child must have the same
  33. prefix P. If it points to a leaf node, the child is not required
  34. to contain any record with a prefix equal to P. The leaf case
  35. is decided this way to allow arbitrary deletions in a leaf node
  36. without touching upper levels of the tree.
  37. We have predefined a special minimum record which we
  38. define as the smallest record in any alphabetical order.
  39. A minimum record is denoted by setting a bit in the record
  40. header. A minimum record acts as the prefix of a node pointer
  41. which points to a leftmost node on any level of the tree.
  42. File page allocation
  43. --------------------
  44. In the root node of a B-tree there are two file segment headers.
  45. The leaf pages of a tree are allocated from one file segment, to
  46. make them consecutive on disk if possible. From the other file segment
  47. we allocate pages for the non-leaf levels of the tree.
  48. */
  49. /* If this many inserts occur sequentially, it affects page split */
  50. #define BTR_PAGE_SEQ_INSERT_LIMIT 5
  51. /******************************************************************
  52. Creates a new index page to the tree (not the root, and also not
  53. used in page reorganization). */
  54. static
  55. void
  56. btr_page_create(
  57. /*============*/
  58. page_t* page, /* in: page to be created */
  59. dict_tree_t* tree, /* in: index tree */
  60. mtr_t* mtr); /* in: mtr */
  61. /******************************************************************
  62. Allocates a new file page to be used in an index tree. */
  63. static
  64. page_t*
  65. btr_page_alloc(
  66. /*===========*/
  67. /* out: new allocated page,
  68. x-latched */
  69. dict_tree_t* tree, /* in: index tree */
  70. ulint hint_page_no, /* in: hint of a good page */
  71. byte file_direction, /* in: direction where a possible
  72. page split is made */
  73. ulint level, /* in: level where the page is placed
  74. in the tree */
  75. mtr_t* mtr); /* in: mtr */
  76. /******************************************************************
  77. Frees a file page used in an index tree. */
  78. static
  79. void
  80. btr_page_free(
  81. /*==========*/
  82. dict_tree_t* tree, /* in: index tree */
  83. page_t* page, /* in, own: page to be freed */
  84. mtr_t* mtr); /* in: mtr */
  85. /******************************************************************
  86. Sets the child node file address in a node pointer. */
  87. UNIV_INLINE
  88. void
  89. btr_node_ptr_set_child_page_no(
  90. /*===========================*/
  91. rec_t* rec, /* in: node pointer record */
  92. ulint page_no, /* in: child node address */
  93. mtr_t* mtr); /* in: mtr */
  94. /****************************************************************
  95. Returns the upper level node pointer to a page. It is assumed that
  96. mtr holds an x-latch on the tree. */
  97. static
  98. rec_t*
  99. btr_page_get_father_node_ptr(
  100. /*=========================*/
  101. /* out: pointer to node pointer record */
  102. dict_tree_t* tree, /* in: index tree */
  103. page_t* page, /* in: page: must contain at least one
  104. user record */
  105. mtr_t* mtr); /* in: mtr */
  106. /*****************************************************************
  107. Empties an index page. */
  108. static
  109. void
  110. btr_page_empty(
  111. /*===========*/
  112. page_t* page, /* in: page to be emptied */
  113. mtr_t* mtr); /* in: mtr */
  114. /*****************************************************************
  115. Returns TRUE if the insert fits on the appropriate half-page
  116. with the chosen split_rec. */
  117. static
  118. ibool
  119. btr_page_insert_fits(
  120. /*=================*/
  121. /* out: TRUE if fits */
  122. btr_cur_t* cursor, /* in: cursor at which insert
  123. should be made */
  124. rec_t* split_rec, /* in: suggestion for first record
  125. on upper half-page, or NULL if
  126. tuple should be first */
  127. dtuple_t* tuple); /* in: tuple to insert */
  128. /******************************************************************
  129. Gets the root node of a tree and x-latches it. */
  130. static
  131. page_t*
  132. btr_root_get(
  133. /*=========*/
  134. /* out: root page, x-latched */
  135. dict_tree_t* tree, /* in: index tree */
  136. mtr_t* mtr) /* in: mtr */
  137. {
  138. ulint space;
  139. ulint root_page_no;
  140. page_t* root;
  141. ut_ad(mtr_memo_contains(mtr, dict_tree_get_lock(tree), MTR_MEMO_X_LOCK)
  142.   || mtr_memo_contains(mtr, dict_tree_get_lock(tree), MTR_MEMO_S_LOCK));
  143. space = dict_tree_get_space(tree);
  144. root_page_no = dict_tree_get_page(tree);
  145. root = btr_page_get(space, root_page_no, RW_X_LATCH, mtr);
  146. return(root);
  147. }
  148. /*****************************************************************
  149. Gets pointer to the previous user record in the tree. It is assumed that
  150. the caller has appropriate latches on the page and its neighbor. */
  151. rec_t*
  152. btr_get_prev_user_rec(
  153. /*==================*/
  154. /* out: previous user record, NULL if there is none */
  155. rec_t* rec, /* in: record on leaf level */
  156. mtr_t* mtr) /* in: mtr holding a latch on the page, and if
  157. needed, also to the previous page */
  158. {
  159. page_t* page;
  160. page_t* prev_page;
  161. ulint prev_page_no;
  162. rec_t* prev_rec;
  163. ulint space;
  164. page = buf_frame_align(rec);
  165. if (page_get_infimum_rec(page) != rec) {
  166. prev_rec = page_rec_get_prev(rec);
  167. if (page_get_infimum_rec(page) != prev_rec) {
  168. return(prev_rec);
  169. }
  170. }
  171. prev_page_no = btr_page_get_prev(page, mtr);
  172. space = buf_frame_get_space_id(page);
  173. if (prev_page_no != FIL_NULL) {
  174. prev_page = buf_page_get_with_no_latch(space, prev_page_no,
  175. mtr);
  176. /* The caller must already have a latch to the brother */
  177. ut_ad((mtr_memo_contains(mtr, buf_block_align(prev_page),
  178.        MTR_MEMO_PAGE_S_FIX))
  179.       || (mtr_memo_contains(mtr, buf_block_align(prev_page),
  180.        MTR_MEMO_PAGE_X_FIX)));
  181. prev_rec = page_rec_get_prev(page_get_supremum_rec(prev_page));
  182. return(prev_rec);
  183. }
  184. return(NULL);
  185. }
  186. /*****************************************************************
  187. Gets pointer to the next user record in the tree. It is assumed that the
  188. caller has appropriate latches on the page and its neighbor. */
  189. rec_t*
  190. btr_get_next_user_rec(
  191. /*==================*/
  192. /* out: next user record, NULL if there is none */
  193. rec_t* rec, /* in: record on leaf level */
  194. mtr_t* mtr) /* in: mtr holding a latch on the page, and if
  195. needed, also to the next page */
  196. {
  197. page_t* page;
  198. page_t* next_page;
  199. ulint next_page_no;
  200. rec_t* next_rec;
  201. ulint space;
  202. page = buf_frame_align(rec);
  203. if (page_get_supremum_rec(page) != rec) {
  204. next_rec = page_rec_get_next(rec);
  205. if (page_get_supremum_rec(page) != next_rec) {
  206. return(next_rec);
  207. }
  208. }
  209. next_page_no = btr_page_get_next(page, mtr);
  210. space = buf_frame_get_space_id(page);
  211. if (next_page_no != FIL_NULL) {
  212. next_page = buf_page_get_with_no_latch(space, next_page_no,
  213. mtr);
  214. /* The caller must already have a latch to the brother */
  215. ut_ad((mtr_memo_contains(mtr, buf_block_align(next_page),
  216.        MTR_MEMO_PAGE_S_FIX))
  217.       || (mtr_memo_contains(mtr, buf_block_align(next_page),
  218.        MTR_MEMO_PAGE_X_FIX)));
  219. next_rec = page_rec_get_next(page_get_infimum_rec(next_page));
  220. return(next_rec);
  221. }
  222. return(NULL);
  223. }
  224. /******************************************************************
  225. Creates a new index page to the tree (not the root, and also not used in
  226. page reorganization). */
  227. static
  228. void
  229. btr_page_create(
  230. /*============*/
  231. page_t* page, /* in: page to be created */
  232. dict_tree_t* tree, /* in: index tree */
  233. mtr_t* mtr) /* in: mtr */
  234. {
  235. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  236.        MTR_MEMO_PAGE_X_FIX));
  237. page_create(page, mtr);
  238. btr_page_set_index_id(page, tree->id, mtr);
  239. }
  240. /******************************************************************
  241. Allocates a new file page to be used in an ibuf tree. Takes the page from
  242. the free list of the tree, which must contain pages! */
  243. static
  244. page_t*
  245. btr_page_alloc_for_ibuf(
  246. /*====================*/
  247. /* out: new allocated page, x-latched */
  248. dict_tree_t* tree, /* in: index tree */
  249. mtr_t* mtr) /* in: mtr */
  250. {
  251. fil_addr_t node_addr;
  252. page_t* root;
  253. page_t* new_page;
  254. root = btr_root_get(tree, mtr);
  255. node_addr = flst_get_first(root + PAGE_HEADER
  256. + PAGE_BTR_IBUF_FREE_LIST, mtr);
  257. ut_a(node_addr.page != FIL_NULL);
  258. new_page = buf_page_get(dict_tree_get_space(tree), node_addr.page,
  259. RW_X_LATCH, mtr);
  260. buf_page_dbg_add_level(new_page, SYNC_TREE_NODE_NEW);
  261. flst_remove(root + PAGE_HEADER + PAGE_BTR_IBUF_FREE_LIST,
  262.     new_page + PAGE_HEADER + PAGE_BTR_IBUF_FREE_LIST_NODE,
  263. mtr);
  264. ut_ad(flst_validate(root + PAGE_HEADER + PAGE_BTR_IBUF_FREE_LIST, mtr));
  265. return(new_page);
  266. }
  267. /******************************************************************
  268. Allocates a new file page to be used in an index tree. NOTE: we assume
  269. that the caller has made the reservation for free extents! */
  270. static
  271. page_t*
  272. btr_page_alloc(
  273. /*===========*/
  274. /* out: new allocated page, x-latched */
  275. dict_tree_t* tree, /* in: index tree */
  276. ulint hint_page_no, /* in: hint of a good page */
  277. byte file_direction, /* in: direction where a possible
  278. page split is made */
  279. ulint level, /* in: level where the page is placed
  280. in the tree */
  281. mtr_t* mtr) /* in: mtr */
  282. {
  283. fseg_header_t* seg_header;
  284. page_t* root;
  285. page_t* new_page;
  286. ulint new_page_no;
  287. ut_ad(mtr_memo_contains(mtr, dict_tree_get_lock(tree),
  288. MTR_MEMO_X_LOCK));
  289. if (tree->type & DICT_IBUF) {
  290. return(btr_page_alloc_for_ibuf(tree, mtr));
  291. }
  292. root = btr_root_get(tree, mtr);
  293. if (level == 0) {
  294. seg_header = root + PAGE_HEADER + PAGE_BTR_SEG_LEAF;
  295. } else {
  296. seg_header = root + PAGE_HEADER + PAGE_BTR_SEG_TOP;
  297. }
  298. /* Parameter TRUE below states that the caller has made the
  299. reservation for free extents, and thus we know that a page can
  300. be allocated: */
  301. new_page_no = fseg_alloc_free_page_general(seg_header, hint_page_no,
  302. file_direction, TRUE, mtr);
  303. ut_a(new_page_no != FIL_NULL);
  304. new_page = buf_page_get(dict_tree_get_space(tree), new_page_no,
  305. RW_X_LATCH, mtr);
  306. buf_page_dbg_add_level(new_page, SYNC_TREE_NODE_NEW);
  307. return(new_page);
  308. }
  309. /******************************************************************
  310. Gets the number of pages in a B-tree. */
  311. ulint
  312. btr_get_size(
  313. /*=========*/
  314. /* out: number of pages */
  315. dict_index_t* index, /* in: index */
  316. ulint flag) /* in: BTR_N_LEAF_PAGES or BTR_TOTAL_SIZE */
  317. {
  318. fseg_header_t* seg_header;
  319. page_t* root;
  320. ulint n;
  321. ulint dummy;
  322. mtr_t mtr;
  323. mtr_start(&mtr);
  324. mtr_s_lock(dict_tree_get_lock(index->tree), &mtr);
  325. root = btr_root_get(index->tree, &mtr);
  326. if (flag == BTR_N_LEAF_PAGES) {
  327. seg_header = root + PAGE_HEADER + PAGE_BTR_SEG_LEAF;
  328. fseg_n_reserved_pages(seg_header, &n, &mtr);
  329. } else if (flag == BTR_TOTAL_SIZE) {
  330. seg_header = root + PAGE_HEADER + PAGE_BTR_SEG_TOP;
  331. n = fseg_n_reserved_pages(seg_header, &dummy, &mtr);
  332. seg_header = root + PAGE_HEADER + PAGE_BTR_SEG_LEAF;
  333. n += fseg_n_reserved_pages(seg_header, &dummy, &mtr);
  334. } else {
  335. ut_a(0);
  336. }
  337. mtr_commit(&mtr);
  338. return(n);
  339. }
  340. /******************************************************************
  341. Frees a page used in an ibuf tree. Puts the page to the free list of the
  342. ibuf tree. */
  343. static
  344. void
  345. btr_page_free_for_ibuf(
  346. /*===================*/
  347. dict_tree_t* tree, /* in: index tree */
  348. page_t* page, /* in: page to be freed, x-latched */
  349. mtr_t* mtr) /* in: mtr */
  350. {
  351. page_t* root;
  352. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  353.        MTR_MEMO_PAGE_X_FIX));
  354. root = btr_root_get(tree, mtr);
  355. flst_add_first(root + PAGE_HEADER + PAGE_BTR_IBUF_FREE_LIST,
  356.        page + PAGE_HEADER + PAGE_BTR_IBUF_FREE_LIST_NODE, mtr);
  357. ut_ad(flst_validate(root + PAGE_HEADER + PAGE_BTR_IBUF_FREE_LIST, mtr));
  358. }
  359. /******************************************************************
  360. Frees a file page used in an index tree. */
  361. static
  362. void
  363. btr_page_free(
  364. /*==========*/
  365. dict_tree_t* tree, /* in: index tree */
  366. page_t* page, /* in: page to be freed, x-latched */
  367. mtr_t* mtr) /* in: mtr */
  368. {
  369. fseg_header_t* seg_header;
  370. page_t* root;
  371. ulint space;
  372. ulint page_no;
  373. ulint level;
  374. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  375.        MTR_MEMO_PAGE_X_FIX));
  376. /* The page gets invalid for optimistic searches: increment the frame
  377. modify clock */
  378. buf_frame_modify_clock_inc(page);
  379. if (tree->type & DICT_IBUF) {
  380. btr_page_free_for_ibuf(tree, page, mtr);
  381. return;
  382. }
  383. root = btr_root_get(tree, mtr);
  384. level = btr_page_get_level(page, mtr);
  385. if (level == 0) {
  386. seg_header = root + PAGE_HEADER + PAGE_BTR_SEG_LEAF;
  387. } else {
  388. seg_header = root + PAGE_HEADER + PAGE_BTR_SEG_TOP;
  389. }
  390. space = buf_frame_get_space_id(page);
  391. page_no = buf_frame_get_page_no(page);
  392. fseg_free_page(seg_header, space, page_no, mtr);
  393. }
  394. /******************************************************************
  395. Sets the child node file address in a node pointer. */
  396. UNIV_INLINE
  397. void
  398. btr_node_ptr_set_child_page_no(
  399. /*===========================*/
  400. rec_t* rec, /* in: node pointer record */
  401. ulint page_no, /* in: child node address */
  402. mtr_t* mtr) /* in: mtr */
  403. {
  404. ulint n_fields;
  405. byte* field;
  406. ulint len;
  407. ut_ad(0 < btr_page_get_level(buf_frame_align(rec), mtr));
  408. n_fields = rec_get_n_fields(rec);
  409. /* The child address is in the last field */
  410. field = rec_get_nth_field(rec, n_fields - 1, &len);
  411. ut_ad(len == 4);
  412. mlog_write_ulint(field, page_no, MLOG_4BYTES, mtr);
  413. }
  414. /****************************************************************
  415. Returns the child page of a node pointer and x-latches it. */
  416. static
  417. page_t*
  418. btr_node_ptr_get_child(
  419. /*===================*/
  420.   /* out: child page, x-latched */
  421. rec_t* node_ptr, /* in: node pointer */
  422. mtr_t* mtr) /* in: mtr */
  423. {
  424. ulint page_no;
  425. ulint space;
  426. page_t* page;
  427. space = buf_frame_get_space_id(node_ptr);
  428. page_no = btr_node_ptr_get_child_page_no(node_ptr);
  429. page = btr_page_get(space, page_no, RW_X_LATCH, mtr);
  430. return(page);
  431. }
  432. /****************************************************************
  433. Returns the upper level node pointer to a page. It is assumed that mtr holds
  434. an x-latch on the tree. */
  435. static
  436. rec_t*
  437. btr_page_get_father_for_rec(
  438. /*========================*/
  439. /* out: pointer to node pointer record,
  440. its page x-latched */
  441. dict_tree_t* tree, /* in: index tree */
  442. page_t* page, /* in: page: must contain at least one
  443. user record */
  444. rec_t* user_rec,/* in: user_record on page */
  445. mtr_t* mtr) /* in: mtr */
  446. {
  447. mem_heap_t* heap;
  448. dtuple_t* tuple;
  449. btr_cur_t cursor;
  450. rec_t* node_ptr;
  451. ut_ad(mtr_memo_contains(mtr, dict_tree_get_lock(tree),
  452. MTR_MEMO_X_LOCK));
  453. ut_ad(user_rec != page_get_supremum_rec(page));
  454. ut_ad(user_rec != page_get_infimum_rec(page));
  455. ut_ad(dict_tree_get_page(tree) != buf_frame_get_page_no(page));
  456. heap = mem_heap_create(100);
  457. tuple = dict_tree_build_node_ptr(tree, user_rec, 0, heap);
  458. /* In the following, we choose just any index from the tree as the
  459. first parameter for btr_cur_search_to_nth_level. */
  460. btr_cur_search_to_nth_level(UT_LIST_GET_FIRST(tree->tree_indexes),
  461. btr_page_get_level(page, mtr) + 1,
  462. tuple, PAGE_CUR_LE,
  463. BTR_CONT_MODIFY_TREE, &cursor, 0, mtr);
  464. node_ptr = btr_cur_get_rec(&cursor);
  465. ut_ad(btr_node_ptr_get_child_page_no(node_ptr) ==
  466. buf_frame_get_page_no(page));
  467. mem_heap_free(heap);
  468. return(node_ptr);
  469. }
  470. /****************************************************************
  471. Returns the upper level node pointer to a page. It is assumed that
  472. mtr holds an x-latch on the tree. */
  473. static
  474. rec_t*
  475. btr_page_get_father_node_ptr(
  476. /*=========================*/
  477. /* out: pointer to node pointer record */
  478. dict_tree_t* tree, /* in: index tree */
  479. page_t* page, /* in: page: must contain at least one
  480. user record */
  481. mtr_t* mtr) /* in: mtr */
  482. {
  483. return(btr_page_get_father_for_rec(tree, page,
  484. page_rec_get_next(page_get_infimum_rec(page)), mtr));
  485. }
  486. /****************************************************************
  487. Creates the root node for a new index tree. */
  488. ulint
  489. btr_create(
  490. /*=======*/
  491. /* out: page number of the created root, FIL_NULL if
  492. did not succeed */
  493. ulint type, /* in: type of the index */
  494. ulint space, /* in: space where created */
  495. dulint index_id,/* in: index id */
  496. mtr_t* mtr) /* in: mini-transaction handle */
  497. {
  498. ulint page_no;
  499. buf_frame_t* ibuf_hdr_frame;
  500. buf_frame_t* frame;
  501. page_t* page;
  502. /* Create the two new segments (one, in the case of an ibuf tree) for
  503. the index tree; the segment headers are put on the allocated root page
  504. (for an ibuf tree, not in the root, but on a separate ibuf header
  505. page) */
  506. if (type & DICT_IBUF) {
  507. /* Allocate first the ibuf header page */
  508. ibuf_hdr_frame = fseg_create(space, 0,
  509. IBUF_HEADER + IBUF_TREE_SEG_HEADER, mtr);
  510. buf_page_dbg_add_level(ibuf_hdr_frame, SYNC_TREE_NODE_NEW);
  511. ut_ad(buf_frame_get_page_no(ibuf_hdr_frame)
  512.   == IBUF_HEADER_PAGE_NO);
  513. /* Allocate then the next page to the segment: it will be the
  514.   tree root page */
  515.   page_no = fseg_alloc_free_page(
  516. ibuf_hdr_frame + IBUF_HEADER
  517.   + IBUF_TREE_SEG_HEADER, IBUF_TREE_ROOT_PAGE_NO,
  518. FSP_UP, mtr);
  519. ut_ad(page_no == IBUF_TREE_ROOT_PAGE_NO);
  520. frame = buf_page_get(space, page_no, RW_X_LATCH, mtr);
  521. } else {
  522. frame = fseg_create(space, 0, PAGE_HEADER + PAGE_BTR_SEG_TOP,
  523. mtr);
  524. }
  525. if (frame == NULL) {
  526. return(FIL_NULL);
  527. }
  528. page_no = buf_frame_get_page_no(frame);
  529. buf_page_dbg_add_level(frame, SYNC_TREE_NODE_NEW);
  530. if (type & DICT_IBUF) {
  531. /* It is an insert buffer tree: initialize the free list */
  532. ut_ad(page_no == IBUF_TREE_ROOT_PAGE_NO);
  533. flst_init(frame + PAGE_HEADER + PAGE_BTR_IBUF_FREE_LIST, mtr);
  534. } else {
  535. /* It is a non-ibuf tree: create a file segment for leaf
  536. pages */
  537. fseg_create(space, page_no, PAGE_HEADER + PAGE_BTR_SEG_LEAF,
  538. mtr);
  539. /* The fseg create acquires a second latch on the page,
  540. therefore we must declare it: */
  541. buf_page_dbg_add_level(frame, SYNC_TREE_NODE_NEW);
  542. }
  543. /* Create a new index page on the the allocated segment page */
  544. page = page_create(frame, mtr);
  545. /* Set the index id of the page */
  546. btr_page_set_index_id(page, index_id, mtr);
  547. /* Set the level of the new index page */
  548. btr_page_set_level(page, 0, mtr);
  549. /* Set the next node and previous node fields */
  550. btr_page_set_next(page, FIL_NULL, mtr);
  551. btr_page_set_prev(page, FIL_NULL, mtr);
  552. /* We reset the free bits for the page to allow creation of several
  553. trees in the same mtr, otherwise the latch on a bitmap page would
  554. prevent it because of the latching order */
  555. ibuf_reset_free_bits_with_type(type, page);
  556. /* In the following assertion we test that two records of maximum
  557. allowed size fit on the root page: this fact is needed to ensure
  558. correctness of split algorithms */
  559. ut_ad(page_get_max_insert_size(page, 2) > 2 * BTR_PAGE_MAX_REC_SIZE);
  560. return(page_no);
  561. }
  562. /****************************************************************
  563. Frees a B-tree except the root page, which MUST be freed after this
  564. by calling btr_free_root. */
  565. void
  566. btr_free_but_not_root(
  567. /*==================*/
  568. ulint space, /* in: space where created */
  569. ulint root_page_no) /* in: root page number */
  570. {
  571. ibool finished;
  572. page_t* root;
  573. mtr_t mtr;
  574. leaf_loop:
  575. mtr_start(&mtr);
  576. root = btr_page_get(space, root_page_no, RW_X_LATCH, &mtr);
  577. /* NOTE: page hash indexes are dropped when a page is freed inside
  578. fsp0fsp. */
  579. finished = fseg_free_step(
  580. root + PAGE_HEADER + PAGE_BTR_SEG_LEAF, &mtr);
  581. mtr_commit(&mtr);
  582. if (!finished) {
  583. goto leaf_loop;
  584. }
  585. top_loop:
  586. mtr_start(&mtr);
  587. root = btr_page_get(space, root_page_no, RW_X_LATCH, &mtr);
  588. finished = fseg_free_step_not_header(
  589. root + PAGE_HEADER + PAGE_BTR_SEG_TOP, &mtr);
  590. mtr_commit(&mtr);
  591. if (!finished) {
  592. goto top_loop;
  593. }
  594. }
  595. /****************************************************************
  596. Frees the B-tree root page. Other tree MUST already have been freed. */
  597. void
  598. btr_free_root(
  599. /*==========*/
  600. ulint space, /* in: space where created */
  601. ulint root_page_no, /* in: root page number */
  602. mtr_t* mtr) /* in: a mini-transaction which has already
  603. been started */
  604. {
  605. ibool finished;
  606. page_t* root;
  607. root = btr_page_get(space, root_page_no, RW_X_LATCH, mtr);
  608. btr_search_drop_page_hash_index(root);
  609. top_loop:
  610. finished = fseg_free_step(
  611. root + PAGE_HEADER + PAGE_BTR_SEG_TOP, mtr);
  612. if (!finished) {
  613. goto top_loop;
  614. }
  615. }
  616. /*****************************************************************
  617. Reorganizes an index page. */
  618. void
  619. btr_page_reorganize_low(
  620. /*====================*/
  621. ibool low, /* in: TRUE if locks should not be updated, i.e.,
  622. there cannot exist locks on the page */
  623. page_t* page, /* in: page to be reorganized */
  624. mtr_t* mtr) /* in: mtr */
  625. {
  626. page_t* new_page;
  627. ulint log_mode;
  628. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  629.        MTR_MEMO_PAGE_X_FIX));
  630. /* Write the log record */
  631. mlog_write_initial_log_record(page, MLOG_PAGE_REORGANIZE, mtr);
  632. /* Turn logging off */
  633. log_mode = mtr_set_log_mode(mtr, MTR_LOG_NONE);
  634. new_page = buf_frame_alloc();
  635. /* Copy the old page to temporary space */
  636. buf_frame_copy(new_page, page);
  637. btr_search_drop_page_hash_index(page);
  638. /* Recreate the page: note that global data on page (possible
  639. segment headers, next page-field, etc.) is preserved intact */
  640. page_create(page, mtr);
  641. /* Copy the records from the temporary space to the recreated page;
  642. do not copy the lock bits yet */
  643. page_copy_rec_list_end_no_locks(page, new_page,
  644. page_get_infimum_rec(new_page), mtr);
  645. /* Copy max trx id to recreated page */
  646. page_set_max_trx_id(page, page_get_max_trx_id(new_page));
  647. if (!low) {
  648. /* Update the record lock bitmaps */
  649. lock_move_reorganize_page(page, new_page);
  650. }
  651. buf_frame_free(new_page);
  652. /* Restore logging mode */
  653. mtr_set_log_mode(mtr, log_mode);
  654. }
  655. /*****************************************************************
  656. Reorganizes an index page. */
  657. void
  658. btr_page_reorganize(
  659. /*================*/
  660. page_t* page, /* in: page to be reorganized */
  661. mtr_t* mtr) /* in: mtr */
  662. {
  663. btr_page_reorganize_low(FALSE, page, mtr);
  664. }
  665. /***************************************************************
  666. Parses a redo log record of reorganizing a page. */
  667. byte*
  668. btr_parse_page_reorganize(
  669. /*======================*/
  670. /* out: end of log record or NULL */
  671. byte* ptr, /* in: buffer */
  672. byte* end_ptr,/* in: buffer end */
  673. page_t* page, /* in: page or NULL */
  674. mtr_t* mtr) /* in: mtr or NULL */
  675. {
  676. ut_ad(ptr && end_ptr);
  677. /* The record is empty, except for the record initial part */
  678. if (page) {
  679. btr_page_reorganize_low(TRUE, page, mtr);
  680. }
  681. return(ptr);
  682. }
  683. /*****************************************************************
  684. Empties an index page. */
  685. static
  686. void
  687. btr_page_empty(
  688. /*===========*/
  689. page_t* page, /* in: page to be emptied */
  690. mtr_t* mtr) /* in: mtr */
  691. {
  692. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  693.        MTR_MEMO_PAGE_X_FIX));
  694. btr_search_drop_page_hash_index(page);
  695. /* Recreate the page: note that global data on page (possible
  696. segment headers, next page-field, etc.) is preserved intact */
  697. page_create(page, mtr);
  698. }
  699. /*****************************************************************
  700. Makes tree one level higher by splitting the root, and inserts
  701. the tuple. It is assumed that mtr contains an x-latch on the tree.
  702. NOTE that the operation of this function must always succeed,
  703. we cannot reverse it: therefore enough free disk space must be
  704. guaranteed to be available before this function is called. */
  705. rec_t*
  706. btr_root_raise_and_insert(
  707. /*======================*/
  708. /* out: inserted record */
  709. btr_cur_t* cursor, /* in: cursor at which to insert: must be
  710. on the root page; when the function returns,
  711. the cursor is positioned on the predecessor
  712. of the inserted record */
  713. dtuple_t* tuple, /* in: tuple to insert */
  714. mtr_t* mtr) /* in: mtr */
  715. {
  716. dict_tree_t* tree;
  717. page_t* root;
  718. page_t* new_page;
  719. ulint new_page_no;
  720. rec_t* rec;
  721. mem_heap_t* heap;
  722. dtuple_t* node_ptr;
  723. ulint level;
  724. rec_t* node_ptr_rec;
  725. page_cur_t* page_cursor;
  726. root = btr_cur_get_page(cursor);
  727. tree = btr_cur_get_tree(cursor);
  728. ut_ad(dict_tree_get_page(tree) == buf_frame_get_page_no(root));
  729. ut_ad(mtr_memo_contains(mtr, dict_tree_get_lock(tree),
  730. MTR_MEMO_X_LOCK));
  731. ut_ad(mtr_memo_contains(mtr, buf_block_align(root),
  732.        MTR_MEMO_PAGE_X_FIX));
  733. btr_search_drop_page_hash_index(root);
  734. /* Allocate a new page to the tree. Root splitting is done by first
  735. moving the root records to the new page, emptying the root, putting
  736. a node pointer to the new page, and then splitting the new page. */
  737. new_page = btr_page_alloc(tree, 0, FSP_NO_DIR,
  738.   btr_page_get_level(root, mtr), mtr);
  739. btr_page_create(new_page, tree, mtr);
  740. level = btr_page_get_level(root, mtr);
  741. /* Set the levels of the new index page and root page */
  742. btr_page_set_level(new_page, level, mtr);
  743. btr_page_set_level(root, level + 1, mtr);
  744. /* Set the next node and previous node fields of new page */
  745. btr_page_set_next(new_page, FIL_NULL, mtr);
  746. btr_page_set_prev(new_page, FIL_NULL, mtr);
  747. /* Move the records from root to the new page */
  748. page_move_rec_list_end(new_page, root, page_get_infimum_rec(root),
  749. mtr);
  750. /* If this is a pessimistic insert which is actually done to
  751. perform a pessimistic update then we have stored the lock
  752. information of the record to be inserted on the infimum of the
  753. root page: we cannot discard the lock structs on the root page */
  754. lock_update_root_raise(new_page, root);
  755. /* Create a memory heap where the node pointer is stored */
  756. heap = mem_heap_create(100);
  757. rec = page_rec_get_next(page_get_infimum_rec(new_page));
  758. new_page_no = buf_frame_get_page_no(new_page);
  759. /* Build the node pointer (= node key and page address) for the
  760. child */
  761. node_ptr = dict_tree_build_node_ptr(tree, rec, new_page_no, heap);
  762. /* Reorganize the root to get free space */
  763. btr_page_reorganize(root, mtr);
  764. page_cursor = btr_cur_get_page_cur(cursor);
  765. /* Insert node pointer to the root */
  766. page_cur_set_before_first(root, page_cursor);
  767. node_ptr_rec = page_cur_tuple_insert(page_cursor, node_ptr, mtr);
  768. ut_ad(node_ptr_rec);
  769. /* The node pointer must be marked as the predefined minimum record,
  770. as there is no lower alphabetical limit to records in the leftmost
  771. node of a level: */
  772. btr_set_min_rec_mark(node_ptr_rec, mtr);
  773. /* Free the memory heap */
  774. mem_heap_free(heap);
  775. /* We play safe and reset the free bits for the new page */
  776. /* printf("Root raise new page no %lun",
  777. buf_frame_get_page_no(new_page)); */
  778. ibuf_reset_free_bits(UT_LIST_GET_FIRST(tree->tree_indexes),
  779. new_page);
  780. /* Reposition the cursor to the child node */
  781. page_cur_search(new_page, tuple, PAGE_CUR_LE, page_cursor);
  782. /* Split the child and insert tuple */
  783. return(btr_page_split_and_insert(cursor, tuple, mtr));
  784. }
  785. /*****************************************************************
  786. Decides if the page should be split at the convergence point of inserts
  787. converging to the left. */
  788. ibool
  789. btr_page_get_split_rec_to_left(
  790. /*===========================*/
  791. /* out: TRUE if split recommended */
  792. btr_cur_t* cursor, /* in: cursor at which to insert */
  793. rec_t** split_rec) /* out: if split recommended,
  794. the first record on upper half page,
  795. or NULL if tuple to be inserted should
  796. be first */
  797. {
  798. page_t* page;
  799. rec_t* insert_point;
  800. rec_t* infimum;
  801. page = btr_cur_get_page(cursor);
  802. insert_point = btr_cur_get_rec(cursor);
  803. if ((page_header_get_ptr(page, PAGE_LAST_INSERT)
  804.     == page_rec_get_next(insert_point))
  805.     && (page_header_get_field(page, PAGE_DIRECTION) == PAGE_LEFT)
  806.     && ((page_header_get_field(page, PAGE_N_DIRECTION)
  807.         >= BTR_PAGE_SEQ_INSERT_LIMIT)
  808.       || (page_header_get_field(page, PAGE_N_DIRECTION) + 1
  809.         >= page_get_n_recs(page)))) {
  810.       infimum = page_get_infimum_rec(page);
  811.        
  812. if ((infimum != insert_point)
  813.     && (page_rec_get_next(infimum) != insert_point)) {
  814. *split_rec = insert_point;
  815. } else {
  816.       *split_rec = page_rec_get_next(insert_point);
  817.       }
  818. return(TRUE);
  819. }
  820. return(FALSE);
  821. }
  822. /*****************************************************************
  823. Decides if the page should be split at the convergence point of inserts
  824. converging to the right. */
  825. ibool
  826. btr_page_get_split_rec_to_right(
  827. /*============================*/
  828. /* out: TRUE if split recommended */
  829. btr_cur_t* cursor, /* in: cursor at which to insert */
  830. rec_t** split_rec) /* out: if split recommended,
  831. the first record on upper half page,
  832. or NULL if tuple to be inserted should
  833. be first */
  834. {
  835. page_t* page;
  836. rec_t* insert_point;
  837. rec_t* supremum;
  838. page = btr_cur_get_page(cursor);
  839. insert_point = btr_cur_get_rec(cursor);
  840. if ((page_header_get_ptr(page, PAGE_LAST_INSERT) == insert_point)
  841.     && (page_header_get_field(page, PAGE_DIRECTION) == PAGE_RIGHT)
  842.     && ((page_header_get_field(page, PAGE_N_DIRECTION)
  843.         >= BTR_PAGE_SEQ_INSERT_LIMIT)
  844.       || (page_header_get_field(page, PAGE_N_DIRECTION) + 1
  845.         >= page_get_n_recs(page)))) {
  846.       supremum = page_get_supremum_rec(page);
  847.        
  848. if ((page_rec_get_next(insert_point) != supremum)
  849.     && (page_rec_get_next(page_rec_get_next(insert_point))
  850. != supremum)
  851.     && (page_rec_get_next(page_rec_get_next(
  852. page_rec_get_next(insert_point)))
  853. != supremum)) {
  854. /* If there are >= 3 user records up from the insert
  855. point, split all but 2 off */
  856. *split_rec = page_rec_get_next(page_rec_get_next(
  857. page_rec_get_next(insert_point)));
  858. } else {
  859. /* Else split at inserted record */
  860.       *split_rec = NULL;
  861.       }
  862. return(TRUE);
  863. }
  864. return(FALSE);
  865. }
  866. /*****************************************************************
  867. Calculates a split record such that the tuple will certainly fit on
  868. its half-page when the split is performed. We assume in this function
  869. only that the cursor page has at least one user record. */
  870. static
  871. rec_t*
  872. btr_page_get_sure_split_rec(
  873. /*========================*/
  874. /* out: split record, or NULL if
  875. tuple will be the first record on
  876. upper half-page */
  877. btr_cur_t* cursor, /* in: cursor at which insert
  878. should be made */
  879. dtuple_t* tuple) /* in: tuple to insert */
  880. {
  881. page_t* page;
  882. ulint insert_size;
  883. ulint free_space;
  884. ulint total_data;
  885. ulint total_n_recs;
  886. ulint total_space;
  887. ulint incl_data;
  888. rec_t* ins_rec;
  889. rec_t* rec;
  890. rec_t* next_rec;
  891. ulint n;
  892. page = btr_cur_get_page(cursor);
  893. insert_size = rec_get_converted_size(tuple);
  894. free_space  = page_get_free_space_of_empty();
  895. /* free_space is now the free space of a created new page */
  896. total_data   = page_get_data_size(page) + insert_size;
  897. total_n_recs = page_get_n_recs(page) + 1;
  898. ut_ad(total_n_recs >= 2);
  899. total_space  = total_data + page_dir_calc_reserved_space(total_n_recs);
  900. n = 0;
  901. incl_data = 0;
  902. ins_rec = btr_cur_get_rec(cursor);
  903. rec = page_get_infimum_rec(page);
  904. /* We start to include records to the left half, and when the
  905. space reserved by them exceeds half of total_space, then if
  906. the included records fit on the left page, they will be put there
  907. if something was left over also for the right page,
  908. otherwise the last included record will be the first on the right
  909. half page */
  910. for (;;) {
  911. /* Decide the next record to include */
  912. if (rec == ins_rec) {
  913. rec = NULL; /* NULL denotes that tuple is
  914. now included */
  915. } else if (rec == NULL) {
  916. rec = page_rec_get_next(ins_rec);
  917. } else {
  918. rec = page_rec_get_next(rec);
  919. }
  920. if (rec == NULL) {
  921. /* Include tuple */
  922. incl_data += insert_size;
  923. } else {
  924. incl_data += rec_get_size(rec);
  925. }
  926. n++;
  927. if (incl_data + page_dir_calc_reserved_space(n)
  928.                     >= total_space / 2) {
  929.                      if (incl_data + page_dir_calc_reserved_space(n)
  930.                          <= free_space) {
  931.                           /* The next record will be the first on
  932.                           the right half page if it is not the
  933.                           supremum record of page */
  934. if (rec == ins_rec) {
  935. next_rec = NULL;
  936. } else if (rec == NULL) {
  937. next_rec = page_rec_get_next(ins_rec);
  938. } else {
  939. next_rec = page_rec_get_next(rec);
  940. }
  941. if (next_rec != page_get_supremum_rec(page)) {
  942. return(next_rec);
  943. }
  944.                      }
  945. return(rec);
  946. }
  947. }
  948. }
  949. /*****************************************************************
  950. Returns TRUE if the insert fits on the appropriate half-page with the
  951. chosen split_rec. */
  952. static
  953. ibool
  954. btr_page_insert_fits(
  955. /*=================*/
  956. /* out: TRUE if fits */
  957. btr_cur_t* cursor, /* in: cursor at which insert
  958. should be made */
  959. rec_t* split_rec, /* in: suggestion for first record
  960. on upper half-page, or NULL if
  961. tuple to be inserted should be first */
  962. dtuple_t* tuple) /* in: tuple to insert */
  963. {
  964. page_t* page;
  965. ulint insert_size;
  966. ulint free_space;
  967. ulint total_data;
  968. ulint total_n_recs;
  969. rec_t* rec;
  970. rec_t* end_rec;
  971. page = btr_cur_get_page(cursor);
  972. insert_size = rec_get_converted_size(tuple);
  973. free_space  = page_get_free_space_of_empty();
  974. /* free_space is now the free space of a created new page */
  975. total_data   = page_get_data_size(page) + insert_size;
  976. total_n_recs = page_get_n_recs(page) + 1;
  977. /* We determine which records (from rec to end_rec, not including
  978. end_rec) will end up on the other half page from tuple when it is
  979. inserted. */
  980. if (split_rec == NULL) {
  981. rec = page_rec_get_next(page_get_infimum_rec(page));
  982. end_rec = page_rec_get_next(btr_cur_get_rec(cursor));
  983. } else if (cmp_dtuple_rec(tuple, split_rec) >= 0) {
  984. rec = page_rec_get_next(page_get_infimum_rec(page));
  985.   end_rec = split_rec;
  986. } else {
  987. rec = split_rec;
  988. end_rec = page_get_supremum_rec(page);
  989. }
  990. if (total_data + page_dir_calc_reserved_space(total_n_recs)
  991.     <= free_space) {
  992. /* Ok, there will be enough available space on the
  993. half page where the tuple is inserted */
  994. return(TRUE);
  995. }
  996. while (rec != end_rec) {
  997. /* In this loop we calculate the amount of reserved
  998. space after rec is removed from page. */
  999. total_data -= rec_get_size(rec);
  1000. total_n_recs--;
  1001. if (total_data + page_dir_calc_reserved_space(total_n_recs)
  1002.                     <= free_space) {
  1003. /* Ok, there will be enough available space on the
  1004. half page where the tuple is inserted */
  1005. return(TRUE);
  1006. }
  1007. rec = page_rec_get_next(rec);
  1008. }
  1009. return(FALSE);
  1010. }
  1011. /***********************************************************
  1012. Inserts a data tuple to a tree on a non-leaf level. It is assumed
  1013. that mtr holds an x-latch on the tree. */
  1014. void
  1015. btr_insert_on_non_leaf_level(
  1016. /*=========================*/
  1017. dict_tree_t* tree, /* in: tree */
  1018. ulint level, /* in: level, must be > 0 */
  1019. dtuple_t* tuple, /* in: the record to be inserted */
  1020. mtr_t* mtr) /* in: mtr */
  1021. {
  1022. btr_cur_t cursor;
  1023. ulint err;
  1024. rec_t* rec;
  1025. ut_ad(level > 0);
  1026. /* In the following, choose just any index from the tree as the
  1027. first parameter for btr_cur_search_to_nth_level. */
  1028. btr_cur_search_to_nth_level(UT_LIST_GET_FIRST(tree->tree_indexes),
  1029.     level, tuple, PAGE_CUR_LE,
  1030.     BTR_CONT_MODIFY_TREE,
  1031.     &cursor, 0, mtr);
  1032. err = btr_cur_pessimistic_insert(BTR_NO_LOCKING_FLAG
  1033. | BTR_KEEP_SYS_FLAG
  1034. | BTR_NO_UNDO_LOG_FLAG,
  1035. &cursor, tuple,
  1036. &rec, NULL, mtr);
  1037. ut_a(err == DB_SUCCESS);
  1038. }
  1039. /******************************************************************
  1040. Attaches the halves of an index page on the appropriate level in an
  1041. index tree. */
  1042. static
  1043. void
  1044. btr_attach_half_pages(
  1045. /*==================*/
  1046. dict_tree_t* tree, /* in: the index tree */
  1047. page_t* page, /* in: page to be split */
  1048. rec_t* split_rec, /* in: first record on upper
  1049. half page */
  1050. page_t* new_page, /* in: the new half page */
  1051. ulint direction, /* in: FSP_UP or FSP_DOWN */
  1052. mtr_t* mtr) /* in: mtr */
  1053. {
  1054. ulint space;
  1055. rec_t* node_ptr;
  1056. page_t* prev_page;
  1057. page_t* next_page;
  1058. ulint prev_page_no;
  1059. ulint next_page_no;
  1060. ulint level;
  1061. page_t* lower_page;
  1062. page_t* upper_page;
  1063. ulint lower_page_no;
  1064. ulint upper_page_no;
  1065. dtuple_t* node_ptr_upper;
  1066. mem_heap_t*  heap;
  1067. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1068.        MTR_MEMO_PAGE_X_FIX));
  1069. ut_ad(mtr_memo_contains(mtr, buf_block_align(new_page),
  1070.        MTR_MEMO_PAGE_X_FIX));
  1071. /* Based on split direction, decide upper and lower pages */
  1072. if (direction == FSP_DOWN) {
  1073. lower_page_no = buf_frame_get_page_no(new_page);
  1074. upper_page_no = buf_frame_get_page_no(page);
  1075. lower_page = new_page;
  1076. upper_page = page;
  1077. /* Look from the tree for the node pointer to page */
  1078. node_ptr = btr_page_get_father_node_ptr(tree, page, mtr);
  1079. /* Replace the address of the old child node (= page) with the 
  1080. address of the new lower half */
  1081. btr_node_ptr_set_child_page_no(node_ptr, lower_page_no, mtr);
  1082. } else {
  1083. lower_page_no = buf_frame_get_page_no(page);
  1084. upper_page_no = buf_frame_get_page_no(new_page);
  1085. lower_page = page;
  1086. upper_page = new_page;
  1087. }
  1088.    
  1089. /* Create a memory heap where the data tuple is stored */
  1090. heap = mem_heap_create(100);
  1091. /* Get the level of the split pages */
  1092. level = btr_page_get_level(page, mtr);
  1093. /* Build the node pointer (= node key and page address) for the upper
  1094. half */
  1095. node_ptr_upper = dict_tree_build_node_ptr(tree, split_rec,
  1096. upper_page_no, heap);
  1097. /* Insert it next to the pointer to the lower half. Note that this
  1098. may generate recursion leading to a split on the higher level. */
  1099. btr_insert_on_non_leaf_level(tree, level + 1, node_ptr_upper, mtr);
  1100. /* Free the memory heap */
  1101. mem_heap_free(heap);
  1102. /* Get the previous and next pages of page */
  1103. prev_page_no = btr_page_get_prev(page, mtr);
  1104. next_page_no = btr_page_get_next(page, mtr);
  1105. space = buf_frame_get_space_id(page);
  1106. /* Update page links of the level */
  1107. if (prev_page_no != FIL_NULL) {
  1108. prev_page = btr_page_get(space, prev_page_no, RW_X_LATCH, mtr);
  1109. btr_page_set_next(prev_page, lower_page_no, mtr);
  1110. }
  1111. if (next_page_no != FIL_NULL) {
  1112. next_page = btr_page_get(space, next_page_no, RW_X_LATCH, mtr);
  1113. btr_page_set_prev(next_page, upper_page_no, mtr);
  1114. }
  1115. btr_page_set_prev(lower_page, prev_page_no, mtr);
  1116. btr_page_set_next(lower_page, upper_page_no, mtr);
  1117. btr_page_set_level(lower_page, level, mtr);
  1118. btr_page_set_prev(upper_page, lower_page_no, mtr);
  1119. btr_page_set_next(upper_page, next_page_no, mtr);
  1120. btr_page_set_level(upper_page, level, mtr);
  1121. }
  1122. /*****************************************************************
  1123. Splits an index page to halves and inserts the tuple. It is assumed
  1124. that mtr holds an x-latch to the index tree. NOTE: the tree x-latch
  1125. is released within this function! NOTE that the operation of this
  1126. function must always succeed, we cannot reverse it: therefore
  1127. enough free disk space must be guaranteed to be available before
  1128. this function is called. */
  1129. rec_t*
  1130. btr_page_split_and_insert(
  1131. /*======================*/
  1132. /* out: inserted record; NOTE: the tree
  1133. x-latch is released! NOTE: 2 free disk
  1134. pages must be available! */
  1135. btr_cur_t* cursor, /* in: cursor at which to insert; when the
  1136. function returns, the cursor is positioned
  1137. on the predecessor of the inserted record */
  1138. dtuple_t* tuple, /* in: tuple to insert */
  1139. mtr_t* mtr) /* in: mtr */
  1140. {
  1141. dict_tree_t* tree;
  1142. page_t* page;
  1143. ulint page_no;
  1144. byte direction;
  1145. ulint hint_page_no;
  1146. page_t* new_page;
  1147. rec_t* split_rec;
  1148. page_t* left_page;
  1149. page_t* right_page;
  1150. page_t* insert_page;
  1151. page_cur_t* page_cursor;
  1152. rec_t* first_rec;
  1153. byte* buf;
  1154. rec_t* move_limit;
  1155. ibool insert_will_fit;
  1156. ulint n_iterations = 0;
  1157. rec_t* rec;
  1158. func_start:
  1159. tree = btr_cur_get_tree(cursor);
  1160. ut_ad(mtr_memo_contains(mtr, dict_tree_get_lock(tree),
  1161. MTR_MEMO_X_LOCK));
  1162. ut_ad(rw_lock_own(dict_tree_get_lock(tree), RW_LOCK_EX));
  1163. page = btr_cur_get_page(cursor);
  1164. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1165.        MTR_MEMO_PAGE_X_FIX));
  1166. ut_ad(page_get_n_recs(page) >= 2);
  1167. page_no = buf_frame_get_page_no(page);
  1168. /* 1. Decide the split record; split_rec == NULL means that the
  1169. tuple to be inserted should be the first record on the upper
  1170. half-page */
  1171. if (n_iterations > 0) {
  1172. direction = FSP_UP;
  1173. hint_page_no = page_no + 1;
  1174. split_rec = btr_page_get_sure_split_rec(cursor, tuple);
  1175. } else if (btr_page_get_split_rec_to_right(cursor, &split_rec)) {
  1176. direction = FSP_UP;
  1177. hint_page_no = page_no + 1;
  1178. } else if (btr_page_get_split_rec_to_left(cursor, &split_rec)) {
  1179. direction = FSP_DOWN;
  1180. hint_page_no = page_no - 1;
  1181. } else {
  1182. direction = FSP_UP;
  1183. hint_page_no = page_no + 1;
  1184. split_rec = page_get_middle_rec(page);
  1185. }
  1186. /* 2. Allocate a new page to the tree */
  1187. new_page = btr_page_alloc(tree, hint_page_no, direction,
  1188. btr_page_get_level(page, mtr), mtr);
  1189. btr_page_create(new_page, tree, mtr);
  1190. /* 3. Calculate the first record on the upper half-page, and the
  1191. first record (move_limit) on original page which ends up on the
  1192. upper half */
  1193. if (split_rec != NULL) {
  1194. first_rec = split_rec;
  1195. move_limit = split_rec;
  1196. } else {
  1197. buf = mem_alloc(rec_get_converted_size(tuple));
  1198. first_rec = rec_convert_dtuple_to_rec(buf, tuple);
  1199. move_limit = page_rec_get_next(btr_cur_get_rec(cursor));
  1200. }
  1201. /* 4. Do first the modifications in the tree structure */
  1202. btr_attach_half_pages(tree, page, first_rec, new_page, direction, mtr);
  1203. if (split_rec == NULL) {
  1204. mem_free(buf);
  1205. }
  1206. /* If the split is made on the leaf level and the insert will fit
  1207. on the appropriate half-page, we may release the tree x-latch.
  1208. We can then move the records after releasing the tree latch,
  1209. thus reducing the tree latch contention. */
  1210. insert_will_fit = btr_page_insert_fits(cursor, split_rec, tuple);
  1211. if (insert_will_fit && (btr_page_get_level(page, mtr) == 0)) {
  1212. mtr_memo_release(mtr, dict_tree_get_lock(tree),
  1213. MTR_MEMO_X_LOCK);
  1214. }
  1215. /* 5. Move then the records to the new page */
  1216. if (direction == FSP_DOWN) {
  1217. /* printf("Split leftn"); */
  1218. page_move_rec_list_start(new_page, page, move_limit, mtr);
  1219. left_page = new_page;
  1220. right_page = page;
  1221. lock_update_split_left(right_page, left_page);
  1222. } else {
  1223. /* printf("Split rightn"); */
  1224. page_move_rec_list_end(new_page, page, move_limit, mtr);
  1225. left_page = page;
  1226. right_page = new_page;
  1227. lock_update_split_right(right_page, left_page);
  1228. }
  1229. /* 6. The split and the tree modification is now completed. Decide the
  1230. page where the tuple should be inserted */
  1231. if (split_rec == NULL) {
  1232. insert_page = right_page;
  1233. } else if (cmp_dtuple_rec(tuple, first_rec) >= 0) {
  1234. insert_page = right_page;
  1235. } else {
  1236. insert_page = left_page;
  1237. }
  1238. /* 7. Reposition the cursor for insert and try insertion */
  1239. page_cursor = btr_cur_get_page_cur(cursor);
  1240. page_cur_search(insert_page, tuple, PAGE_CUR_LE, page_cursor);
  1241. rec = page_cur_tuple_insert(page_cursor, tuple, mtr);
  1242. if (rec != NULL) {
  1243. /* Insert fit on the page: update the free bits for the
  1244. left and right pages in the same mtr */
  1245. ibuf_update_free_bits_for_two_pages_low(cursor->index,
  1246. left_page,
  1247. right_page, mtr);
  1248. /* printf("Split and insert done %lu %lun",
  1249. buf_frame_get_page_no(left_page),
  1250. buf_frame_get_page_no(right_page)); */
  1251. return(rec);
  1252. }
  1253. /* 8. If insert did not fit, try page reorganization */
  1254. btr_page_reorganize(insert_page, mtr);
  1255. page_cur_search(insert_page, tuple, PAGE_CUR_LE, page_cursor);
  1256. rec = page_cur_tuple_insert(page_cursor, tuple, mtr);
  1257. if (rec == NULL) {
  1258. /* The insert did not fit on the page: loop back to the
  1259. start of the function for a new split */
  1260. /* We play safe and reset the free bits for new_page */
  1261. ibuf_reset_free_bits(cursor->index, new_page);
  1262. /* printf("Split second round %lun",
  1263. buf_frame_get_page_no(page)); */
  1264. n_iterations++;
  1265. ut_ad(n_iterations < 2);
  1266. ut_ad(!insert_will_fit);
  1267. goto func_start;
  1268. }
  1269. /* Insert fit on the page: update the free bits for the
  1270. left and right pages in the same mtr */
  1271. ibuf_update_free_bits_for_two_pages_low(cursor->index, left_page,
  1272. right_page, mtr);
  1273. /* printf("Split and insert done %lu %lun",
  1274. buf_frame_get_page_no(left_page),
  1275. buf_frame_get_page_no(right_page)); */
  1276. ut_ad(page_validate(left_page, UT_LIST_GET_FIRST(tree->tree_indexes)));
  1277. ut_ad(page_validate(right_page, UT_LIST_GET_FIRST(tree->tree_indexes)));
  1278. return(rec);
  1279. }
  1280. /*****************************************************************
  1281. Removes a page from the level list of pages. */
  1282. static
  1283. void
  1284. btr_level_list_remove(
  1285. /*==================*/
  1286. dict_tree_t* tree, /* in: index tree */
  1287. page_t* page, /* in: page to remove */
  1288. mtr_t* mtr) /* in: mtr */
  1289. {
  1290. ulint space;
  1291. ulint prev_page_no;
  1292. page_t* prev_page;
  1293. ulint next_page_no;
  1294. page_t* next_page;
  1295. ut_ad(tree && page && mtr);
  1296. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1297.        MTR_MEMO_PAGE_X_FIX));
  1298. /* Get the previous and next page numbers of page */
  1299. prev_page_no = btr_page_get_prev(page, mtr);
  1300. next_page_no = btr_page_get_next(page, mtr);
  1301. space = buf_frame_get_space_id(page);
  1302. /* Update page links of the level */
  1303. if (prev_page_no != FIL_NULL) {
  1304. prev_page = btr_page_get(space, prev_page_no, RW_X_LATCH, mtr);
  1305. btr_page_set_next(prev_page, next_page_no, mtr);
  1306. }
  1307. if (next_page_no != FIL_NULL) {
  1308. next_page = btr_page_get(space, next_page_no, RW_X_LATCH, mtr);
  1309. btr_page_set_prev(next_page, prev_page_no, mtr);
  1310. }
  1311. }
  1312. /********************************************************************
  1313. Writes the redo log record for setting an index record as the predefined
  1314. minimum record. */
  1315. UNIV_INLINE
  1316. void
  1317. btr_set_min_rec_mark_log(
  1318. /*=====================*/
  1319. rec_t* rec, /* in: record */
  1320. mtr_t* mtr) /* in: mtr */
  1321. {
  1322. mlog_write_initial_log_record(rec, MLOG_REC_MIN_MARK, mtr);
  1323. /* Write rec offset as a 2-byte ulint */
  1324. mlog_catenate_ulint(mtr, rec - buf_frame_align(rec), MLOG_2BYTES);
  1325. }
  1326. /********************************************************************
  1327. Parses the redo log record for setting an index record as the predefined
  1328. minimum record. */
  1329. byte*
  1330. btr_parse_set_min_rec_mark(
  1331. /*=======================*/
  1332. /* out: end of log record or NULL */
  1333. byte* ptr, /* in: buffer */
  1334. byte* end_ptr,/* in: buffer end */
  1335. page_t* page, /* in: page or NULL */
  1336. mtr_t* mtr) /* in: mtr or NULL */
  1337. {
  1338. rec_t* rec;
  1339. if (end_ptr < ptr + 2) {
  1340. return(NULL);
  1341. }
  1342. if (page) {
  1343. rec = page + mach_read_from_2(ptr);
  1344. btr_set_min_rec_mark(rec, mtr);
  1345. }
  1346. return(ptr + 2);
  1347. }
  1348. /********************************************************************
  1349. Sets a record as the predefined minimum record. */
  1350. void
  1351. btr_set_min_rec_mark(
  1352. /*=================*/
  1353. rec_t* rec, /* in: record */
  1354. mtr_t* mtr) /* in: mtr */
  1355. {
  1356. ulint info_bits;
  1357. info_bits = rec_get_info_bits(rec);
  1358. rec_set_info_bits(rec, info_bits | REC_INFO_MIN_REC_FLAG);
  1359. btr_set_min_rec_mark_log(rec, mtr);
  1360. }
  1361. /*****************************************************************
  1362. Deletes on the upper level the node pointer to a page. */
  1363. void
  1364. btr_node_ptr_delete(
  1365. /*================*/
  1366. dict_tree_t* tree, /* in: index tree */
  1367. page_t* page, /* in: page whose node pointer is deleted */
  1368. mtr_t* mtr) /* in: mtr */
  1369. {
  1370. rec_t* node_ptr;
  1371. btr_cur_t cursor;
  1372. ibool compressed;
  1373. ulint err;
  1374. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1375. MTR_MEMO_PAGE_X_FIX));
  1376. /* Delete node pointer on father page */
  1377. node_ptr = btr_page_get_father_node_ptr(tree, page, mtr);
  1378. btr_cur_position(UT_LIST_GET_FIRST(tree->tree_indexes), node_ptr,
  1379. &cursor);
  1380. compressed = btr_cur_pessimistic_delete(&err, TRUE, &cursor, mtr);
  1381. ut_a(err == DB_SUCCESS);
  1382. if (!compressed) {
  1383. btr_cur_compress_if_useful(&cursor, mtr);
  1384. }
  1385. }
  1386. /*****************************************************************
  1387. If page is the only on its level, this function moves its records to the
  1388. father page, thus reducing the tree height. */
  1389. static
  1390. void
  1391. btr_lift_page_up(
  1392. /*=============*/
  1393. dict_tree_t* tree, /* in: index tree */
  1394. page_t* page, /* in: page which is the only on its level;
  1395. must not be empty: use
  1396. btr_discard_only_page_on_level if the last
  1397. record from the page should be removed */
  1398. mtr_t* mtr) /* in: mtr */
  1399. {
  1400. rec_t* node_ptr;
  1401. page_t* father_page;
  1402. ulint page_level;
  1403. ut_ad(btr_page_get_prev(page, mtr) == FIL_NULL);
  1404. ut_ad(btr_page_get_next(page, mtr) == FIL_NULL);
  1405. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1406.        MTR_MEMO_PAGE_X_FIX));
  1407. node_ptr = btr_page_get_father_node_ptr(tree, page, mtr);
  1408. father_page = buf_frame_align(node_ptr);
  1409. page_level = btr_page_get_level(page, mtr);
  1410. btr_search_drop_page_hash_index(page);
  1411. /* Make the father empty */
  1412. btr_page_empty(father_page, mtr);
  1413. /* Move records to the father */
  1414.   page_copy_rec_list_end(father_page, page, page_get_infimum_rec(page),
  1415. mtr);
  1416. lock_update_copy_and_discard(father_page, page);
  1417. btr_page_set_level(father_page, page_level, mtr);
  1418. /* Free the file page */
  1419. btr_page_free(tree, page, mtr);
  1420. /* We play safe and reset the free bits for the father */
  1421. ibuf_reset_free_bits(UT_LIST_GET_FIRST(tree->tree_indexes),
  1422. father_page);
  1423. ut_ad(page_validate(father_page,
  1424. UT_LIST_GET_FIRST(tree->tree_indexes)));
  1425. ut_ad(btr_check_node_ptr(tree, father_page, mtr));
  1426. }
  1427. /*****************************************************************
  1428. Tries to merge the page first to the left immediate brother if such a
  1429. brother exists, and the node pointers to the current page and to the brother
  1430. reside on the same page. If the left brother does not satisfy these
  1431. conditions, looks at the right brother. If the page is the only one on that
  1432. level lifts the records of the page to the father page, thus reducing the
  1433. tree height. It is assumed that mtr holds an x-latch on the tree and on the
  1434. page. If cursor is on the leaf level, mtr must also hold x-latches to the
  1435. brothers, if they exist. NOTE: it is assumed that the caller has reserved
  1436. enough free extents so that the compression will always succeed if done! */
  1437. void
  1438. btr_compress(
  1439. /*=========*/
  1440. btr_cur_t* cursor, /* in: cursor on the page to merge or lift;
  1441. the page must not be empty: in record delete
  1442. use btr_discard_page if the page would become
  1443. empty */
  1444. mtr_t* mtr) /* in: mtr */
  1445. {
  1446. dict_tree_t* tree;
  1447. ulint space;
  1448. ulint left_page_no;
  1449. ulint right_page_no;
  1450. page_t* merge_page;
  1451. page_t* father_page;
  1452. ibool is_left;
  1453. page_t* page;
  1454. rec_t* orig_pred;
  1455. rec_t* orig_succ;
  1456. rec_t* node_ptr;
  1457. ulint data_size;
  1458. ulint n_recs;
  1459. ulint max_ins_size;
  1460. ulint max_ins_size_reorg;
  1461. ulint level;
  1462. page = btr_cur_get_page(cursor);
  1463. tree = btr_cur_get_tree(cursor);
  1464. ut_ad(mtr_memo_contains(mtr, dict_tree_get_lock(tree),
  1465. MTR_MEMO_X_LOCK));
  1466. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1467. MTR_MEMO_PAGE_X_FIX));
  1468. level = btr_page_get_level(page, mtr);
  1469. space = dict_tree_get_space(tree);
  1470. left_page_no = btr_page_get_prev(page, mtr);
  1471. right_page_no = btr_page_get_next(page, mtr);
  1472. /* printf("Merge left page %lu right %lu n", left_page_no,
  1473. right_page_no); */
  1474. node_ptr = btr_page_get_father_node_ptr(tree, page, mtr);
  1475. father_page = buf_frame_align(node_ptr);
  1476. /* Decide the page to which we try to merge and which will inherit
  1477. the locks */
  1478. if (left_page_no != FIL_NULL) {
  1479. is_left = TRUE;
  1480. merge_page = btr_page_get(space, left_page_no, RW_X_LATCH,
  1481. mtr);
  1482. } else if (right_page_no != FIL_NULL) {
  1483. is_left = FALSE;
  1484. merge_page = btr_page_get(space, right_page_no, RW_X_LATCH,
  1485. mtr);
  1486. } else {
  1487. /* The page is the only one on the level, lift the records
  1488. to the father */
  1489. btr_lift_page_up(tree, page, mtr);
  1490. return;
  1491. }
  1492. n_recs = page_get_n_recs(page);
  1493. data_size = page_get_data_size(page);
  1494. max_ins_size_reorg = page_get_max_insert_size_after_reorganize(
  1495. merge_page, n_recs);
  1496. if (data_size > max_ins_size_reorg) {
  1497. /* No space for merge */
  1498. return;
  1499. }
  1500. ut_ad(page_validate(merge_page, cursor->index));
  1501. max_ins_size = page_get_max_insert_size(merge_page, n_recs);
  1502. if (data_size > max_ins_size) {
  1503. /* We have to reorganize merge_page */
  1504. btr_page_reorganize(merge_page, mtr);
  1505. ut_ad(page_validate(merge_page, cursor->index));
  1506. ut_ad(page_get_max_insert_size(merge_page, n_recs)
  1507. == max_ins_size_reorg);
  1508. }
  1509. btr_search_drop_page_hash_index(page);
  1510. /* Remove the page from the level list */
  1511. btr_level_list_remove(tree, page, mtr);
  1512. if (is_left) {
  1513. btr_node_ptr_delete(tree, page, mtr);
  1514. } else {
  1515. /* Replace the address of the old child node (= page) with the 
  1516. address of the merge page to the right */
  1517. btr_node_ptr_set_child_page_no(node_ptr, right_page_no, mtr);
  1518. btr_node_ptr_delete(tree, merge_page, mtr);
  1519. }
  1520. /* Move records to the merge page */
  1521. if (is_left) {
  1522. orig_pred = page_rec_get_prev(
  1523. page_get_supremum_rec(merge_page));
  1524. page_copy_rec_list_start(merge_page, page,
  1525. page_get_supremum_rec(page), mtr);
  1526. lock_update_merge_left(merge_page, orig_pred, page);
  1527. } else {
  1528. orig_succ = page_rec_get_next(
  1529. page_get_infimum_rec(merge_page));
  1530. page_copy_rec_list_end(merge_page, page,
  1531. page_get_infimum_rec(page), mtr);
  1532. lock_update_merge_right(orig_succ, page);
  1533. }
  1534. /* We have added new records to merge_page: update its free bits */
  1535. ibuf_update_free_bits_if_full(cursor->index, merge_page,
  1536. UNIV_PAGE_SIZE, ULINT_UNDEFINED);
  1537. ut_ad(page_validate(merge_page, cursor->index));
  1538. /* Free the file page */
  1539. btr_page_free(tree, page, mtr);
  1540. ut_ad(btr_check_node_ptr(tree, merge_page, mtr));
  1541. }
  1542. /*****************************************************************
  1543. Discards a page that is the only page on its level. */
  1544. static
  1545. void
  1546. btr_discard_only_page_on_level(
  1547. /*===========================*/
  1548. dict_tree_t* tree, /* in: index tree */
  1549. page_t* page, /* in: page which is the only on its level */
  1550. mtr_t* mtr) /* in: mtr */
  1551. {
  1552. rec_t* node_ptr;
  1553. page_t* father_page;
  1554. ulint page_level;
  1555. ut_ad(btr_page_get_prev(page, mtr) == FIL_NULL);
  1556. ut_ad(btr_page_get_next(page, mtr) == FIL_NULL);
  1557. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1558. MTR_MEMO_PAGE_X_FIX));
  1559. btr_search_drop_page_hash_index(page);
  1560. node_ptr = btr_page_get_father_node_ptr(tree, page, mtr);
  1561. father_page = buf_frame_align(node_ptr);
  1562. page_level = btr_page_get_level(page, mtr);
  1563. lock_update_discard(page_get_supremum_rec(father_page), page);
  1564. btr_page_set_level(father_page, page_level, mtr);
  1565. /* Free the file page */
  1566. btr_page_free(tree, page, mtr);
  1567. if (buf_frame_get_page_no(father_page) == dict_tree_get_page(tree)) {
  1568. /* The father is the root page */
  1569. btr_page_empty(father_page, mtr);
  1570. /* We play safe and reset the free bits for the father */
  1571. ibuf_reset_free_bits(UT_LIST_GET_FIRST(tree->tree_indexes),
  1572. father_page);
  1573. } else {
  1574. ut_ad(page_get_n_recs(father_page) == 1);
  1575. btr_discard_only_page_on_level(tree, father_page, mtr);
  1576. }
  1577. }
  1578. /*****************************************************************
  1579. Discards a page from a B-tree. This is used to remove the last record from
  1580. a B-tree page: the whole page must be removed at the same time. This cannot
  1581. be used for the root page, which is allowed to be empty. */
  1582. void
  1583. btr_discard_page(
  1584. /*=============*/
  1585. btr_cur_t* cursor, /* in: cursor on the page to discard: not on
  1586. the root page */
  1587. mtr_t* mtr) /* in: mtr */
  1588. {
  1589. dict_tree_t* tree;
  1590. ulint space;
  1591. ulint left_page_no;
  1592. ulint right_page_no;
  1593. page_t* merge_page;
  1594. ibool is_left;
  1595. page_t* page;
  1596. rec_t* node_ptr;
  1597. page = btr_cur_get_page(cursor);
  1598. tree = btr_cur_get_tree(cursor);
  1599. ut_ad(dict_tree_get_page(tree) != buf_frame_get_page_no(page));
  1600. ut_ad(mtr_memo_contains(mtr, dict_tree_get_lock(tree),
  1601. MTR_MEMO_X_LOCK));
  1602. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1603. MTR_MEMO_PAGE_X_FIX));
  1604. space = dict_tree_get_space(tree);
  1605. /* Decide the page which will inherit the locks */
  1606. left_page_no = btr_page_get_prev(page, mtr);
  1607. right_page_no = btr_page_get_next(page, mtr);
  1608. if (left_page_no != FIL_NULL) {
  1609. is_left = TRUE;
  1610. merge_page = btr_page_get(space, left_page_no, RW_X_LATCH,
  1611. mtr);
  1612. } else if (right_page_no != FIL_NULL) {
  1613. is_left = FALSE;
  1614. merge_page = btr_page_get(space, right_page_no, RW_X_LATCH,
  1615. mtr);
  1616. } else {
  1617. btr_discard_only_page_on_level(tree, page, mtr);
  1618. return;
  1619. }
  1620. btr_search_drop_page_hash_index(page);
  1621. if ((left_page_no == FIL_NULL)
  1622. && (btr_page_get_level(page, mtr) > 0)) {
  1623. /* We have to mark the leftmost node pointer on the right
  1624. side page as the predefined minimum record */
  1625. node_ptr = page_rec_get_next(page_get_infimum_rec(merge_page));
  1626. ut_ad(node_ptr != page_get_supremum_rec(merge_page));
  1627. btr_set_min_rec_mark(node_ptr, mtr);
  1628. }
  1629. btr_node_ptr_delete(tree, page, mtr);
  1630. /* Remove the page from the level list */
  1631. btr_level_list_remove(tree, page, mtr);
  1632. if (is_left) {
  1633. lock_update_discard(page_get_supremum_rec(merge_page), page);
  1634. } else {
  1635. lock_update_discard(page_rec_get_next(
  1636.     page_get_infimum_rec(merge_page)), page);
  1637. }
  1638. /* Free the file page */
  1639. btr_page_free(tree, page, mtr);
  1640. ut_ad(btr_check_node_ptr(tree, merge_page, mtr));
  1641. }
  1642. /*****************************************************************
  1643. Prints size info of a B-tree. */
  1644. void
  1645. btr_print_size(
  1646. /*===========*/
  1647. dict_tree_t* tree) /* in: index tree */
  1648. {
  1649. page_t* root;
  1650. fseg_header_t* seg;
  1651. mtr_t mtr;
  1652. if (tree->type & DICT_IBUF) {
  1653. printf(
  1654. "Sorry, cannot print info of an ibuf tree: use ibuf functionsn");
  1655. return;
  1656. }
  1657. mtr_start(&mtr);
  1658. root = btr_root_get(tree, &mtr);
  1659. seg = root + PAGE_HEADER + PAGE_BTR_SEG_TOP;
  1660. printf("INFO OF THE NON-LEAF PAGE SEGMENTn");
  1661. fseg_print(seg, &mtr);
  1662. if (!(tree->type & DICT_UNIVERSAL)) {
  1663. seg = root + PAGE_HEADER + PAGE_BTR_SEG_LEAF;
  1664. printf("INFO OF THE LEAF PAGE SEGMENTn");
  1665. fseg_print(seg, &mtr);
  1666. }
  1667. mtr_commit(&mtr); 
  1668. }
  1669. /****************************************************************
  1670. Prints recursively index tree pages. */
  1671. static
  1672. void
  1673. btr_print_recursive(
  1674. /*================*/
  1675. dict_tree_t* tree, /* in: index tree */
  1676. page_t* page, /* in: index page */
  1677. ulint width, /* in: print this many entries from start
  1678. and end */
  1679. mtr_t* mtr) /* in: mtr */
  1680. {
  1681. page_cur_t cursor;
  1682. ulint n_recs;
  1683. ulint i = 0;
  1684. mtr_t mtr2;
  1685. rec_t* node_ptr;
  1686. page_t* child;
  1687. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1688. MTR_MEMO_PAGE_X_FIX));
  1689. printf("NODE ON LEVEL %lu page number %lun",
  1690. btr_page_get_level(page, mtr), buf_frame_get_page_no(page));
  1691. page_print(page, width, width);
  1692. n_recs = page_get_n_recs(page);
  1693. page_cur_set_before_first(page, &cursor);
  1694. page_cur_move_to_next(&cursor);
  1695. while (!page_cur_is_after_last(&cursor)) {
  1696. if (0 == btr_page_get_level(page, mtr)) {
  1697. /* If this is the leaf level, do nothing */
  1698. } else if ((i <= width) || (i >= n_recs - width)) {
  1699. mtr_start(&mtr2);
  1700. node_ptr = page_cur_get_rec(&cursor);
  1701. child = btr_node_ptr_get_child(node_ptr, &mtr2);
  1702. btr_print_recursive(tree, child, width, &mtr2);
  1703. mtr_commit(&mtr2);
  1704. }
  1705. page_cur_move_to_next(&cursor);
  1706. i++;
  1707. }
  1708. }
  1709. /******************************************************************
  1710. Prints directories and other info of all nodes in the tree. */
  1711. void
  1712. btr_print_tree(
  1713. /*===========*/
  1714. dict_tree_t* tree, /* in: tree */
  1715. ulint width) /* in: print this many entries from start
  1716. and end */
  1717. {
  1718. mtr_t mtr;
  1719. page_t* root;
  1720. printf("--------------------------n");
  1721. printf("INDEX TREE PRINTn");
  1722. mtr_start(&mtr);
  1723. root = btr_root_get(tree, &mtr);
  1724. btr_print_recursive(tree, root, width, &mtr);
  1725. mtr_commit(&mtr);
  1726. btr_validate_tree(tree);
  1727. }
  1728. /****************************************************************
  1729. Checks that the node pointer to a page is appropriate. */
  1730. ibool
  1731. btr_check_node_ptr(
  1732. /*===============*/
  1733. /* out: TRUE */
  1734. dict_tree_t* tree, /* in: index tree */
  1735. page_t* page, /* in: index page */
  1736. mtr_t* mtr) /* in: mtr */
  1737. {
  1738. mem_heap_t* heap;
  1739. rec_t* node_ptr;
  1740. dtuple_t* node_ptr_tuple;
  1741. ut_ad(mtr_memo_contains(mtr, buf_block_align(page),
  1742. MTR_MEMO_PAGE_X_FIX));
  1743. if (dict_tree_get_page(tree) == buf_frame_get_page_no(page)) {
  1744. return(TRUE);
  1745. }
  1746. node_ptr = btr_page_get_father_node_ptr(tree, page, mtr);
  1747.  
  1748. if (btr_page_get_level(page, mtr) == 0) {
  1749. return(TRUE);
  1750. }
  1751. heap = mem_heap_create(256);
  1752. node_ptr_tuple = dict_tree_build_node_ptr(
  1753. tree,
  1754. page_rec_get_next(page_get_infimum_rec(page)),
  1755. 0, heap);
  1756. ut_a(cmp_dtuple_rec(node_ptr_tuple, node_ptr) == 0);
  1757. mem_heap_free(heap);
  1758. return(TRUE);
  1759. }
  1760. /****************************************************************
  1761. Validates index tree level. */
  1762. static
  1763. void
  1764. btr_validate_level(
  1765. /*===============*/
  1766. dict_tree_t* tree, /* in: index tree */
  1767. ulint level) /* in: level number */
  1768. {
  1769. ulint space;
  1770. mtr_t mtr;
  1771. page_t* page;
  1772. page_t* right_page;
  1773. page_t* father_page;
  1774. page_t* right_father_page;
  1775. rec_t* node_ptr;
  1776. rec_t* right_node_ptr;
  1777. ulint right_page_no;
  1778. ulint left_page_no;
  1779. page_cur_t cursor;
  1780. mem_heap_t* heap;
  1781. dtuple_t* node_ptr_tuple;
  1782. mtr_start(&mtr);
  1783. page = btr_root_get(tree, &mtr);
  1784. space = buf_frame_get_space_id(page);
  1785. while (level != btr_page_get_level(page, &mtr)) {
  1786. ut_a(btr_page_get_level(page, &mtr) > 0);
  1787. page_cur_set_before_first(page, &cursor);
  1788. page_cur_move_to_next(&cursor);
  1789. node_ptr = page_cur_get_rec(&cursor);
  1790. page = btr_node_ptr_get_child(node_ptr, &mtr);
  1791. }
  1792. /* Now we are on the desired level */
  1793. loop:
  1794. mtr_x_lock(dict_tree_get_lock(tree), &mtr);
  1795. /* Check ordering of records */
  1796. page_validate(page, UT_LIST_GET_FIRST(tree->tree_indexes));
  1797. ut_a(btr_page_get_level(page, &mtr) == level);
  1798. right_page_no = btr_page_get_next(page, &mtr);
  1799. left_page_no = btr_page_get_prev(page, &mtr);
  1800. ut_a((page_get_n_recs(page) > 0)
  1801.      || ((level == 0) &&
  1802.   (buf_frame_get_page_no(page) == dict_tree_get_page(tree))));
  1803. if (right_page_no != FIL_NULL) {
  1804. right_page = btr_page_get(space, right_page_no, RW_X_LATCH,
  1805. &mtr);
  1806. ut_a(cmp_rec_rec(page_rec_get_prev(page_get_supremum_rec(page)),
  1807. page_rec_get_next(page_get_infimum_rec(right_page)),
  1808. UT_LIST_GET_FIRST(tree->tree_indexes)) < 0);
  1809. }
  1810. if ((level > 0) && (left_page_no == FIL_NULL)) {
  1811. ut_a(REC_INFO_MIN_REC_FLAG & rec_get_info_bits(
  1812. page_rec_get_next(page_get_infimum_rec(page))));
  1813. }
  1814. if (buf_frame_get_page_no(page) != dict_tree_get_page(tree)) {
  1815. /* Check father node pointers */
  1816. node_ptr = btr_page_get_father_node_ptr(tree, page, &mtr);
  1817. ut_a(node_ptr == btr_page_get_father_for_rec(tree, page,
  1818. page_rec_get_prev(page_get_supremum_rec(page)), &mtr));
  1819. father_page = buf_frame_align(node_ptr);
  1820. if (btr_page_get_level(page, &mtr) > 0) {
  1821. heap = mem_heap_create(256);
  1822. node_ptr_tuple = dict_tree_build_node_ptr(
  1823. tree,
  1824. page_rec_get_next(
  1825. page_get_infimum_rec(page)),
  1826. 0, heap);
  1827. ut_a(cmp_dtuple_rec(node_ptr_tuple, node_ptr) == 0);
  1828. mem_heap_free(heap);
  1829. }
  1830. if (left_page_no == FIL_NULL) {
  1831. ut_a(node_ptr == page_rec_get_next(
  1832. page_get_infimum_rec(father_page)));
  1833. ut_a(btr_page_get_prev(father_page, &mtr) == FIL_NULL);
  1834. }
  1835. if (right_page_no == FIL_NULL) {
  1836. ut_a(node_ptr == page_rec_get_prev(
  1837. page_get_supremum_rec(father_page)));
  1838. ut_a(btr_page_get_next(father_page, &mtr) == FIL_NULL);
  1839. }
  1840. if (right_page_no != FIL_NULL) {
  1841. right_node_ptr = btr_page_get_father_node_ptr(tree,
  1842. right_page, &mtr);
  1843. if (page_rec_get_next(node_ptr) !=
  1844. page_get_supremum_rec(father_page)) {
  1845. ut_a(right_node_ptr ==
  1846. page_rec_get_next(node_ptr));
  1847. } else {
  1848. right_father_page = buf_frame_align(
  1849. right_node_ptr);
  1850. ut_a(right_node_ptr == page_rec_get_next(
  1851.     page_get_infimum_rec(
  1852. right_father_page)));
  1853. ut_a(buf_frame_get_page_no(right_father_page)
  1854.    == btr_page_get_next(father_page, &mtr));
  1855. }
  1856. }
  1857. }
  1858. mtr_commit(&mtr);
  1859. if (right_page_no != FIL_NULL) {
  1860. mtr_start(&mtr);
  1861. page = btr_page_get(space, right_page_no, RW_X_LATCH, &mtr);
  1862. goto loop;
  1863. }
  1864. }
  1865. /******************************************************************
  1866. Checks the consistency of an index tree. */
  1867. void
  1868. btr_validate_tree(
  1869. /*==============*/
  1870. dict_tree_t* tree) /* in: tree */
  1871. {
  1872. mtr_t mtr;
  1873. page_t* root;
  1874. ulint i;
  1875. ulint n;
  1876. mtr_start(&mtr);
  1877. mtr_x_lock(dict_tree_get_lock(tree), &mtr);
  1878. root = btr_root_get(tree, &mtr);
  1879. n = btr_page_get_level(root, &mtr);
  1880. for (i = 0; i <= n; i++) {
  1881. btr_validate_level(tree, n - i);
  1882. }
  1883. mtr_commit(&mtr);
  1884. }