btr0sea.c
上传用户:tsgydb
上传日期:2007-04-14
资源大小:10674k
文件大小:32k
源码类别:

MySQL数据库

开发平台:

Visual C++

  1. /************************************************************************
  2. The index tree adaptive search
  3. (c) 1996 Innobase Oy
  4. Created 2/17/1996 Heikki Tuuri
  5. *************************************************************************/
  6. #include "btr0sea.h"
  7. #ifdef UNIV_NONINL
  8. #include "btr0sea.ic"
  9. #endif
  10. #include "buf0buf.h"
  11. #include "page0page.h"
  12. #include "page0cur.h"
  13. #include "btr0cur.h"
  14. #include "btr0btr.h"
  15. ulint btr_search_n_succ = 0;
  16. ulint btr_search_n_hash_fail = 0;
  17. byte btr_sea_pad1[64]; /* padding to prevent other memory update
  18. hotspots from residing on the same memory
  19. cache line as btr_search_latch */
  20. /* The latch protecting the adaptive search system: this latch protects the
  21. (1) positions of records on those pages where a hash index has been built.
  22. NOTE: It does not protect values of non-ordering fields within a record from
  23. being updated in-place! We can use fact (1) to perform unique searches to
  24. indexes. */
  25. rw_lock_t* btr_search_latch_temp; /* We will allocate the latch from
  26. dynamic memory to get it to the
  27. same DRAM page as other hotspot
  28. semaphores */
  29. byte btr_sea_pad2[64]; /* padding to prevent other memory update
  30. hotspots from residing on the same memory
  31. cache line */
  32. btr_search_sys_t* btr_search_sys;
  33. /* If the number of records on the page divided by this parameter
  34. would have been successfully accessed using a hash index, the index
  35. is then built on the page, assuming the global limit has been reached */
  36. #define BTR_SEARCH_PAGE_BUILD_LIMIT 16
  37. /* The global limit for consecutive potentially successful hash searches,
  38. before hash index building is started */
  39. #define BTR_SEARCH_BUILD_LIMIT 100
  40. /************************************************************************
  41. Builds a hash index on a page with the given parameters. If the page already
  42. has a hash index with different parameters, the old hash index is removed. */
  43. static
  44. void
  45. btr_search_build_page_hash_index(
  46. /*=============================*/
  47. page_t* page, /* in: index page, s- or x-latched */
  48. ulint n_fields, /* in: hash this many full fields */
  49. ulint n_bytes, /* in: hash this many bytes from the next
  50. field */
  51. ulint side); /* in: hash for searches from this side */
  52. /*********************************************************************
  53. This function should be called before reserving any btr search mutex, if
  54. the intended operation might add nodes to the search system hash table.
  55. Because of the latching order, once we have reserved the btr search system
  56. latch, we cannot allocate a free frame from the buffer pool. Checks that
  57. there is a free buffer frame allocated for hash table heap in the btr search
  58. system. If not, allocates a free frames for the heap. This check makes it
  59. probable that, when have reserved the btr search system latch and we need to
  60. allocate a new node to the hash table, it will succeed. However, the check
  61. will not guarantee success. */
  62. static
  63. void
  64. btr_search_check_free_space_in_heap(void)
  65. /*=====================================*/
  66. {
  67. buf_frame_t* frame;
  68. hash_table_t* table;
  69. mem_heap_t* heap;
  70. ut_ad(!rw_lock_own(&btr_search_latch, RW_LOCK_SHARED)
  71. && !rw_lock_own(&btr_search_latch, RW_LOCK_EX));
  72. table = btr_search_sys->hash_index;
  73. heap = table->heap;
  74. /* Note that we peek the value of heap->free_block without reserving
  75. the latch: this is ok, because we will not guarantee that there will
  76. be enough free space in the hash table. */
  77. if (heap->free_block == NULL) {
  78. frame = buf_frame_alloc();
  79. rw_lock_x_lock(&btr_search_latch);
  80. if (heap->free_block == NULL) {
  81. heap->free_block = frame;
  82. } else {
  83. buf_frame_free(frame);
  84. }
  85. rw_lock_x_unlock(&btr_search_latch);
  86. }
  87. }
  88. /*********************************************************************
  89. Creates and initializes the adaptive search system at a database start. */
  90. void
  91. btr_search_sys_create(
  92. /*==================*/
  93. ulint hash_size) /* in: hash index hash table size */
  94. {
  95. /* We allocate the search latch from dynamic memory:
  96. see above at the global variable definition */
  97. btr_search_latch_temp = mem_alloc(sizeof(rw_lock_t));
  98. rw_lock_create(&btr_search_latch);
  99. btr_search_sys = mem_alloc(sizeof(btr_search_sys_t));
  100. btr_search_sys->hash_index = ha_create(TRUE, hash_size, 0, 0);
  101. rw_lock_set_level(&btr_search_latch, SYNC_SEARCH_SYS);
  102. }
  103. /*********************************************************************
  104. Creates and initializes a search info struct. */
  105. btr_search_t*
  106. btr_search_info_create(
  107. /*===================*/
  108. /* out, own: search info struct */
  109. mem_heap_t* heap) /* in: heap where created */
  110. {
  111. btr_search_t* info;
  112. info = mem_heap_alloc(heap, sizeof(btr_search_t));
  113. info->last_search = NULL;
  114. info->n_direction = 0;
  115. info->root_guess = NULL;
  116. info->hash_analysis = 0;
  117. info->n_hash_potential = 0;
  118. info->last_hash_succ = FALSE;
  119. info->n_hash_succ = 0;
  120. info->n_hash_fail = 0;
  121. info->n_patt_succ = 0;
  122. info->n_searches = 0;
  123. return(info);
  124. }
  125. /*************************************************************************
  126. Updates the search info of an index about hash successes. */
  127. static
  128. void
  129. btr_search_info_update_hash(
  130. /*========================*/
  131. btr_search_t* info, /* in: search info */
  132. btr_cur_t* cursor) /* in: cursor which was just positioned */
  133. {
  134. dict_index_t* index;
  135. ulint n_unique;
  136. int cmp;
  137. ut_ad(!rw_lock_own(&btr_search_latch, RW_LOCK_SHARED)
  138. && !rw_lock_own(&btr_search_latch, RW_LOCK_EX));
  139. index = cursor->index;
  140. if (index->type & DICT_IBUF) {
  141. /* So many deletes are performed on an insert buffer tree
  142. that we do not consider a hash index useful on it: */
  143. return;
  144. }
  145. n_unique = dict_index_get_n_unique_in_tree(index);
  146. if (info->n_hash_potential == 0) {
  147. goto set_new_recomm;
  148. }
  149. /* Test if the search would have succeeded using the recommended
  150. hash prefix */
  151. if ((info->n_fields >= n_unique) && (cursor->up_match >= n_unique)) {
  152. info->n_hash_potential++;
  153. return;
  154. }
  155. cmp = ut_pair_cmp(info->n_fields, info->n_bytes,
  156. cursor->low_match, cursor->low_bytes);
  157. if (((info->side == BTR_SEARCH_LEFT_SIDE) && (cmp <= 0))
  158. || ((info->side == BTR_SEARCH_RIGHT_SIDE) && (cmp > 0))) {
  159. goto set_new_recomm;
  160. }
  161. cmp = ut_pair_cmp(info->n_fields, info->n_bytes,
  162. cursor->up_match, cursor->up_bytes);
  163. if (((info->side == BTR_SEARCH_LEFT_SIDE) && (cmp > 0))
  164. || ((info->side == BTR_SEARCH_RIGHT_SIDE) && (cmp <= 0))) {
  165.      goto set_new_recomm;
  166. }
  167. info->n_hash_potential++;
  168. return;
  169. set_new_recomm:
  170. /* We have to set a new recommendation; skip the hash analysis
  171. for a while to avoid unnecessary CPU time usage when there is no
  172. chance for success */
  173. info->hash_analysis = 0;
  174. if ((cursor->up_match >= n_unique)
  175. || (cursor->low_match >= n_unique)) {
  176. info->n_fields = n_unique;
  177. info->n_bytes = 0;
  178. info->side = BTR_SEARCH_LEFT_SIDE;
  179. }
  180. cmp = ut_pair_cmp(cursor->up_match, cursor->up_bytes,
  181. cursor->low_match, cursor->low_bytes);
  182. if (cmp == 0) {
  183. info->n_hash_potential = 0;
  184. } else if (cmp > 0) {
  185. info->n_hash_potential = 1;
  186. if (cursor->up_match >= n_unique) {
  187. info->n_fields = n_unique;
  188. info->n_bytes = 0;
  189. } else if (cursor->low_match < cursor->up_match) {
  190. info->n_fields = cursor->low_match + 1;
  191. info->n_bytes = 0;
  192. } else {
  193. info->n_fields = cursor->low_match;
  194. info->n_bytes = cursor->low_bytes + 1;
  195. }
  196. info->side = BTR_SEARCH_LEFT_SIDE;
  197. } else {
  198. info->n_hash_potential = 1;
  199. if (cursor->low_match >= n_unique) {
  200. info->n_fields = n_unique;
  201. info->n_bytes = 0;
  202. } else if (cursor->low_match > cursor->up_match) {
  203. info->n_fields = cursor->up_match + 1;
  204. info->n_bytes = 0;
  205. } else {
  206. info->n_fields = cursor->up_match;
  207. info->n_bytes = cursor->up_bytes + 1;
  208. }
  209. info->side = BTR_SEARCH_RIGHT_SIDE;
  210. }
  211. }
  212. /*************************************************************************
  213. Updates the block search info on hash successes. */
  214. static
  215. ibool
  216. btr_search_update_block_hash_info(
  217. /*==============================*/
  218. /* out: TRUE if building a (new) hash index on
  219. the block is recommended */
  220. btr_search_t* info, /* in: search info */
  221. buf_block_t* block, /* in: buffer block */
  222. btr_cur_t* cursor) /* in: cursor */
  223. {
  224. ut_ad(!rw_lock_own(&btr_search_latch, RW_LOCK_SHARED)
  225. && !rw_lock_own(&btr_search_latch, RW_LOCK_EX));
  226. ut_ad(rw_lock_own(&(block->lock), RW_LOCK_SHARED)
  227. || rw_lock_own(&(block->lock), RW_LOCK_EX));
  228. ut_ad(cursor);
  229. info->last_hash_succ = FALSE;
  230. if ((block->n_hash_helps > 0)
  231.     && (info->n_hash_potential > 0)
  232.     && (block->n_fields == info->n_fields)
  233.     && (block->n_bytes == info->n_bytes)
  234.     && (block->side == info->side)) {
  235. if ((block->is_hashed)
  236.     && (block->curr_n_fields == info->n_fields)
  237.     && (block->curr_n_bytes == info->n_bytes)
  238.     && (block->curr_side == info->side)) {
  239. /* The search would presumably have succeeded using
  240. the hash index */
  241.     
  242. info->last_hash_succ = TRUE;
  243. }
  244. block->n_hash_helps++;
  245. } else {
  246. block->n_hash_helps = 1;
  247. block->n_fields = info->n_fields;
  248. block->n_bytes = info->n_bytes;
  249. block->side = info->side;
  250. }
  251. if (cursor->index->table->does_not_fit_in_memory) {
  252. block->n_hash_helps = 0;
  253. }
  254. if ((block->n_hash_helps > page_get_n_recs(block->frame)
  255.      / BTR_SEARCH_PAGE_BUILD_LIMIT)
  256.     && (info->n_hash_potential >= BTR_SEARCH_BUILD_LIMIT)) {
  257.      if ((!block->is_hashed)
  258.     || (block->n_hash_helps
  259. > 2 * page_get_n_recs(block->frame))
  260.     || (block->n_fields != block->curr_n_fields)
  261.     || (block->n_bytes != block->curr_n_bytes)
  262.     || (block->side != block->curr_side)) {
  263.      /* Build a new hash index on the page */
  264.      return(TRUE);
  265. }
  266. }
  267. return(FALSE);
  268. }
  269. /*************************************************************************
  270. Updates a hash node reference when it has been unsuccessfully used in a
  271. search which could have succeeded with the used hash parameters. This can
  272. happen because when building a hash index for a page, we do not check
  273. what happens at page boundaries, and therefore there can be misleading
  274. hash nodes. Also, collisions in the fold value can lead to misleading
  275. references. This function lazily fixes these imperfections in the hash
  276. index. */
  277. static
  278. void
  279. btr_search_update_hash_ref(
  280. /*=======================*/
  281. btr_search_t* info, /* in: search info */
  282. buf_block_t* block, /* in: buffer block where cursor positioned */
  283. btr_cur_t* cursor) /* in: cursor */
  284. {
  285. ulint fold;
  286. rec_t* rec;
  287. dulint tree_id;
  288. ut_ad(cursor->flag == BTR_CUR_HASH_FAIL);
  289. ut_ad(rw_lock_own(&btr_search_latch, RW_LOCK_EX));
  290. ut_ad(rw_lock_own(&(block->lock), RW_LOCK_SHARED)
  291. || rw_lock_own(&(block->lock), RW_LOCK_EX));
  292. if (block->is_hashed
  293.     && (info->n_hash_potential > 0)
  294.     && (block->curr_n_fields == info->n_fields)
  295.     && (block->curr_n_bytes == info->n_bytes)
  296.     && (block->curr_side == info->side)) {
  297.      rec = btr_cur_get_rec(cursor);
  298.      if (!page_rec_is_user_rec(rec)) {
  299.      return;
  300.      }
  301.     
  302. tree_id = ((cursor->index)->tree)->id;
  303. fold = rec_fold(rec, block->curr_n_fields,
  304. block->curr_n_bytes, tree_id);
  305. ut_ad(rw_lock_own(&btr_search_latch, RW_LOCK_EX));
  306. ha_insert_for_fold(btr_search_sys->hash_index, fold, rec);
  307. }
  308. }
  309. /*************************************************************************
  310. Updates the search info. */
  311. void
  312. btr_search_info_update_slow(
  313. /*========================*/
  314. btr_search_t* info, /* in: search info */
  315. btr_cur_t* cursor) /* in: cursor which was just positioned */
  316. {
  317. buf_block_t* block;
  318. ibool build_index;
  319. ut_ad(!rw_lock_own(&btr_search_latch, RW_LOCK_SHARED)
  320. && !rw_lock_own(&btr_search_latch, RW_LOCK_EX));
  321. block = buf_block_align(btr_cur_get_rec(cursor));
  322. btr_search_info_update_hash(info, cursor);
  323. build_index = btr_search_update_block_hash_info(info, block, cursor);
  324. if (build_index || (cursor->flag == BTR_CUR_HASH_FAIL)) {
  325. btr_search_check_free_space_in_heap();
  326. }
  327. if (cursor->flag == BTR_CUR_HASH_FAIL) {
  328. /* Update the hash node reference, if appropriate */
  329. btr_search_n_hash_fail++;
  330. rw_lock_x_lock(&btr_search_latch);
  331. btr_search_update_hash_ref(info, block, cursor);
  332. rw_lock_x_unlock(&btr_search_latch);
  333. }
  334. if (build_index) {
  335. btr_search_build_page_hash_index(block->frame,
  336. block->n_fields,
  337. block->n_bytes,
  338. block->side);
  339. }
  340. }
  341. /**********************************************************************
  342. Checks if a guessed position for a tree cursor is right. Note that if
  343. mode is PAGE_CUR_LE, which is used in inserts, and the function returns
  344. TRUE, then cursor->up_match and cursor->low_match both have sensible values. */
  345. UNIV_INLINE
  346. ibool
  347. btr_search_check_guess(
  348. /*===================*/
  349. /* out: TRUE if success */
  350. btr_cur_t* cursor, /* in: guessed cursor position */
  351. dtuple_t*  tuple, /* in: data tuple */
  352. ulint mode, /* in: PAGE_CUR_L, PAGE_CUR_LE, PAGE_CUR_G,
  353. or PAGE_CUR_GE */
  354. mtr_t* mtr) /* in: mtr */
  355. {
  356. page_t* page;
  357. rec_t* rec;
  358. rec_t* prev_rec;
  359. rec_t* next_rec;
  360. ulint n_unique;
  361. ulint match;
  362. ulint bytes;
  363. int cmp;
  364. n_unique = dict_index_get_n_unique_in_tree(cursor->index);
  365. rec = btr_cur_get_rec(cursor);
  366. page = buf_frame_align(rec);
  367. ut_ad(page_rec_is_user_rec(rec));
  368. match = 0;
  369. bytes = 0;
  370. cmp = page_cmp_dtuple_rec_with_match(tuple, rec, &match, &bytes);
  371. if (mode == PAGE_CUR_GE) {
  372. if (cmp == 1) {
  373. return(FALSE);
  374. }
  375. cursor->up_match = match;
  376. if (match >= n_unique) {
  377. return(TRUE);
  378. }
  379. } else if (mode == PAGE_CUR_LE) {
  380. if (cmp == -1) {
  381. return(FALSE);
  382. }
  383. cursor->low_match = match;
  384. } else if (mode == PAGE_CUR_G) {
  385. if (cmp != -1) {
  386. return(FALSE);
  387. }
  388. } else if (mode == PAGE_CUR_L) {
  389. if (cmp != 1) {
  390. return(FALSE);
  391. }
  392. }
  393. match = 0;
  394. bytes = 0;
  395. if ((mode == PAGE_CUR_G) || (mode == PAGE_CUR_GE)) {
  396. ut_ad(rec != page_get_infimum_rec(page));
  397. prev_rec = page_rec_get_prev(rec);
  398. if (prev_rec == page_get_infimum_rec(page)) {
  399.      if (btr_page_get_prev(page, mtr) != FIL_NULL) {
  400. return(FALSE);
  401. }
  402. return(TRUE);
  403. }
  404. cmp = page_cmp_dtuple_rec_with_match(tuple, prev_rec,
  405. &match, &bytes);
  406. if (mode == PAGE_CUR_GE) {
  407. if (cmp != 1) {
  408. return(FALSE);
  409. }
  410. } else {
  411. if (cmp == -1) {
  412. return(FALSE);
  413. }
  414. }
  415. return(TRUE);
  416. }
  417. ut_ad(rec != page_get_supremum_rec(page));
  418. next_rec = page_rec_get_next(rec);
  419. if (next_rec == page_get_supremum_rec(page)) {
  420.      if (btr_page_get_next(page, mtr) == FIL_NULL) {
  421. cursor->up_match = 0;
  422. return(TRUE);
  423. }
  424. return(FALSE);
  425. }
  426. cmp = page_cmp_dtuple_rec_with_match(tuple, next_rec, &match, &bytes);
  427. if (mode == PAGE_CUR_LE) {
  428. if (cmp != -1) {
  429. return(FALSE);
  430. }
  431. cursor->up_match = match;
  432. } else {
  433. if (cmp == 1) {
  434. return(FALSE);
  435. }
  436. }
  437. return(TRUE);
  438. }
  439. /**********************************************************************
  440. Tries to guess the right search position based on the hash search info
  441. of the index. Note that if mode is PAGE_CUR_LE, which is used in inserts,
  442. and the function returns TRUE, then cursor->up_match and cursor->low_match
  443. both have sensible values. */
  444. ibool
  445. btr_search_guess_on_hash(
  446. /*=====================*/
  447. /* out: TRUE if succeeded */
  448. dict_index_t* index, /* in: index */
  449. btr_search_t* info, /* in: index search info */
  450. dtuple_t* tuple, /* in: logical record */
  451. ulint mode, /* in: PAGE_CUR_L, ... */
  452. ulint latch_mode,  /* in: BTR_SEARCH_LEAF, ... */
  453. btr_cur_t* cursor,  /* out: tree cursor */
  454. ulint has_search_latch,/* in: latch mode the caller
  455. currently has on btr_search_latch:
  456. RW_S_LATCH, RW_X_LATCH, or 0 */
  457. mtr_t* mtr) /* in: mtr */
  458. {
  459. buf_block_t* block;
  460. rec_t* rec;
  461. page_t* page;
  462. ibool success;
  463. ulint fold;
  464. ulint tuple_n_fields;
  465. dulint tree_id;
  466. #ifdef notdefined
  467. btr_cur_t cursor2;
  468. #endif
  469. ut_ad(index && info && tuple && cursor && mtr);
  470. ut_ad((latch_mode == BTR_SEARCH_LEAF)
  471. || (latch_mode == BTR_MODIFY_LEAF));
  472. /* Note that, for efficiency, the struct info may not be protected by
  473. any latch here! */
  474. if (info->n_hash_potential == 0) {
  475. return(FALSE);
  476. }
  477. cursor->n_fields = info->n_fields;
  478. cursor->n_bytes = info->n_bytes;
  479. tuple_n_fields = dtuple_get_n_fields(tuple);
  480. if (tuple_n_fields < cursor->n_fields) {
  481. return(FALSE);
  482. }
  483. if ((cursor->n_bytes > 0) && (tuple_n_fields <= cursor->n_fields)) {
  484.      return(FALSE);
  485. }
  486. tree_id = (index->tree)->id;
  487. #ifdef UNIV_SEARCH_PERF_STAT
  488. info->n_hash_succ++;
  489. #endif
  490. fold = dtuple_fold(tuple, cursor->n_fields, cursor->n_bytes, tree_id);
  491. cursor->fold = fold;
  492. cursor->flag = BTR_CUR_HASH;
  493. if (!has_search_latch) {
  494. rw_lock_s_lock(&btr_search_latch);
  495. }
  496. rec = ha_search_and_get_data(btr_search_sys->hash_index, fold);
  497. if (!rec) {
  498. if (!has_search_latch) {
  499. rw_lock_s_unlock(&btr_search_latch);
  500. }
  501. goto failure;
  502. }
  503. page = buf_frame_align(rec);
  504. if (!has_search_latch) {
  505. success = buf_page_get_known_nowait(latch_mode, page,
  506. BUF_MAKE_YOUNG,
  507. #ifdef UNIV_SYNC_DEBUG
  508. IB__FILE__, __LINE__,
  509. #endif
  510. mtr);
  511. rw_lock_s_unlock(&btr_search_latch);
  512. if (!success) {
  513. goto failure;
  514. }
  515. buf_page_dbg_add_level(page, SYNC_TREE_NODE_FROM_HASH);
  516. }
  517. block = buf_block_align(page);
  518. if (block->state == BUF_BLOCK_REMOVE_HASH) {
  519. if (!has_search_latch) {
  520. btr_leaf_page_release(page, latch_mode, mtr);
  521. }
  522. goto failure;
  523. }
  524. ut_ad(block->state == BUF_BLOCK_FILE_PAGE);
  525. ut_ad(page_rec_is_user_rec(rec));
  526. btr_cur_position(index, rec, cursor);
  527. /* Check the validity of the guess within the page */
  528. if (0 != ut_dulint_cmp(tree_id, btr_page_get_index_id(page))) {
  529. success = FALSE;
  530. /*
  531. printf("Tree id %lu, page index id %lu fold %lun",
  532. ut_dulint_get_low(tree_id),
  533. ut_dulint_get_low(btr_page_get_index_id(page)),
  534. fold);
  535. */
  536. } else {
  537. success = btr_search_check_guess(cursor, tuple, mode, mtr);
  538. }
  539. if (!success) {
  540. btr_leaf_page_release(page, latch_mode, mtr);
  541. goto failure;
  542. }
  543. if (info->n_hash_potential < BTR_SEARCH_BUILD_LIMIT + 5) {
  544. info->n_hash_potential++;
  545. }
  546. if (info->last_hash_succ != TRUE) {
  547. info->last_hash_succ = TRUE;
  548. }
  549. #ifdef notdefined
  550. /* These lines of code can be used in a debug version to check
  551. correctness of the searched cursor position: */
  552. info->last_hash_succ = FALSE;
  553. /* Currently, does not work if the following fails: */
  554. ut_a(!has_search_latch);
  555. btr_leaf_page_release(page, latch_mode, mtr);
  556. btr_cur_search_to_nth_level(index, 0, tuple, mode, latch_mode,
  557. &cursor2, 0, mtr);
  558. ut_a(btr_cur_get_rec(&cursor2) == btr_cur_get_rec(cursor));
  559. info->last_hash_succ = TRUE;
  560. #endif
  561. #ifdef UNIV_SEARCH_PERF_STAT
  562. btr_search_n_succ++;
  563. #endif
  564. if (!has_search_latch && buf_block_peek_if_too_old(block)) {
  565. buf_page_make_young(page);
  566. }
  567. return(TRUE);
  568. /*-------------------------------------------*/
  569. failure:
  570. info->n_hash_fail++;
  571. cursor->flag = BTR_CUR_HASH_FAIL;
  572. #ifdef UNIV_SEARCH_PERF_STAT
  573. if (info->n_hash_succ > 0) {
  574. info->n_hash_succ--;
  575. }
  576. #endif
  577. info->last_hash_succ = FALSE;
  578. return(FALSE);
  579. }
  580. /************************************************************************
  581. Drops a page hash index. */
  582. void
  583. btr_search_drop_page_hash_index(
  584. /*============================*/
  585. page_t* page) /* in: index page, s- or x-latched */
  586. {
  587. hash_table_t* table;
  588. buf_block_t* block;
  589. ulint n_fields;
  590. ulint n_bytes;
  591. rec_t* rec;
  592. rec_t* sup;
  593. ulint fold;
  594. ulint prev_fold;
  595. dulint tree_id;
  596. ulint n_cached;
  597. ulint n_recs;
  598. ulint* folds;
  599. ulint i;
  600. ut_ad(!rw_lock_own(&btr_search_latch, RW_LOCK_SHARED)
  601. && !rw_lock_own(&btr_search_latch, RW_LOCK_EX));
  602. rw_lock_s_lock(&btr_search_latch);
  603. block = buf_block_align(page);
  604. if (!block->is_hashed) {
  605. rw_lock_s_unlock(&btr_search_latch);
  606. return;
  607. }
  608. table = btr_search_sys->hash_index;
  609. ut_ad(rw_lock_own(&(block->lock), RW_LOCK_SHARED)
  610.        || rw_lock_own(&(block->lock), RW_LOCK_EX)
  611.        || (block->buf_fix_count == 0));
  612. n_fields = block->curr_n_fields;
  613. n_bytes = block->curr_n_bytes;
  614. rw_lock_s_unlock(&btr_search_latch);
  615. n_recs = page_get_n_recs(page);
  616. /* Calculate and cache fold values into an array for fast deletion
  617. from the hash index */
  618. folds = mem_alloc(n_recs * sizeof(ulint));
  619. n_cached = 0;
  620. sup = page_get_supremum_rec(page);
  621. rec = page_get_infimum_rec(page);
  622. rec = page_rec_get_next(rec);
  623. tree_id = btr_page_get_index_id(page);
  624. prev_fold = 0;
  625. while (rec != sup) {
  626. /* FIXME: in a mixed tree, not all records may have enough
  627. ordering fields: */
  628. fold = rec_fold(rec, n_fields, n_bytes, tree_id);
  629. if ((fold == prev_fold) && (prev_fold != 0)) {
  630. goto next_rec;
  631. }
  632. /* Remove all hash nodes pointing to this page from the
  633. hash chain */
  634. folds[n_cached] = fold;
  635. n_cached++;
  636. next_rec:
  637. rec = page_rec_get_next(rec);
  638. }
  639. rw_lock_x_lock(&btr_search_latch);
  640. for (i = 0; i < n_cached; i++) {
  641. ha_remove_all_nodes_to_page(table, folds[i], page);
  642. }
  643. block->is_hashed = FALSE;
  644. rw_lock_x_unlock(&btr_search_latch);
  645. mem_free(folds);
  646. }
  647. /************************************************************************
  648. Drops a page hash index when a page is freed from a fseg to the file system.
  649. Drops possible hash index if the page happens to be in the buffer pool. */
  650. void
  651. btr_search_drop_page_hash_when_freed(
  652. /*=================================*/
  653. ulint space, /* in: space id */
  654. ulint page_no) /* in: page number */
  655. {
  656. ibool is_hashed;
  657. page_t* page;
  658. mtr_t mtr;
  659. is_hashed = buf_page_peek_if_search_hashed(space, page_no);
  660. if (!is_hashed) {
  661. return;
  662. }
  663. mtr_start(&mtr);
  664. /* We assume that if the caller has a latch on the page,
  665. then the caller has already drooped the hash index for the page,
  666. and we never get here. Therefore we can acquire the s-latch to
  667. the page without fearing a deadlock. */
  668. page = buf_page_get(space, page_no, RW_S_LATCH, &mtr);
  669. buf_page_dbg_add_level(page, SYNC_TREE_NODE_FROM_HASH);
  670. btr_search_drop_page_hash_index(page);
  671. mtr_commit(&mtr);
  672. }
  673. /************************************************************************
  674. Builds a hash index on a page with the given parameters. If the page already
  675. has a hash index with different parameters, the old hash index is removed. */
  676. static
  677. void
  678. btr_search_build_page_hash_index(
  679. /*=============================*/
  680. page_t* page, /* in: index page, s- or x-latched */
  681. ulint n_fields, /* in: hash this many full fields */
  682. ulint n_bytes, /* in: hash this many bytes from the next
  683. field */
  684. ulint side) /* in: hash for searches from this side */
  685. {
  686. hash_table_t* table;
  687. buf_block_t* block;
  688. rec_t* rec;
  689. rec_t* next_rec;
  690. rec_t* sup;
  691. ulint fold;
  692. ulint next_fold;
  693. dulint tree_id;
  694. ulint n_cached;
  695. ulint n_recs;
  696. ulint* folds;
  697. rec_t** recs;
  698. ulint i;
  699. block = buf_block_align(page);
  700. table = btr_search_sys->hash_index;
  701. ut_ad(!rw_lock_own(&btr_search_latch, RW_LOCK_EX));
  702. ut_ad(rw_lock_own(&(block->lock), RW_LOCK_SHARED)
  703. || rw_lock_own(&(block->lock), RW_LOCK_EX));
  704. rw_lock_s_lock(&btr_search_latch);
  705. if (block->is_hashed && ((block->curr_n_fields != n_fields)
  706.          || (block->curr_n_bytes != n_bytes)
  707.          || (block->curr_side != side))) {
  708. rw_lock_s_unlock(&btr_search_latch);
  709. btr_search_drop_page_hash_index(page);
  710. } else {
  711. rw_lock_s_unlock(&btr_search_latch);
  712. }
  713. n_recs = page_get_n_recs(page);
  714. if (n_recs == 0) {
  715. return;
  716. }
  717. /* Calculate and cache fold values and corresponding records into
  718. an array for fast insertion to the hash index */
  719. folds = mem_alloc(n_recs * sizeof(ulint));
  720. recs = mem_alloc(n_recs * sizeof(rec_t*));
  721. n_cached = 0;
  722. tree_id = btr_page_get_index_id(page);
  723. sup = page_get_supremum_rec(page);
  724. rec = page_get_infimum_rec(page);
  725. rec = page_rec_get_next(rec);
  726. /* FIXME: in a mixed tree, all records may not have enough ordering
  727. fields: */
  728. fold = rec_fold(rec, n_fields, n_bytes, tree_id);
  729. if (side == BTR_SEARCH_LEFT_SIDE) {
  730. folds[n_cached] = fold;
  731. recs[n_cached] = rec;
  732. n_cached++;
  733. }
  734. for (;;) {
  735. next_rec = page_rec_get_next(rec);
  736. if (next_rec == sup) {
  737. if (side == BTR_SEARCH_RIGHT_SIDE) {
  738. folds[n_cached] = fold;
  739. recs[n_cached] = rec;
  740. n_cached++;
  741. }
  742.   break;
  743. }
  744. next_fold = rec_fold(next_rec, n_fields, n_bytes, tree_id);
  745. if (fold != next_fold) {
  746. /* Insert an entry into the hash index */
  747. if (side == BTR_SEARCH_LEFT_SIDE) {
  748. folds[n_cached] = next_fold;
  749. recs[n_cached] = next_rec;
  750. n_cached++;
  751. } else {
  752. folds[n_cached] = fold;
  753. recs[n_cached] = rec;
  754. n_cached++;
  755. }
  756. }
  757. rec = next_rec;
  758. fold = next_fold;
  759. }
  760. btr_search_check_free_space_in_heap();
  761. rw_lock_x_lock(&btr_search_latch);
  762. if (block->is_hashed && ((block->curr_n_fields != n_fields)
  763.          || (block->curr_n_bytes != n_bytes)
  764.          || (block->curr_side != side))) {
  765. rw_lock_x_unlock(&btr_search_latch);
  766. mem_free(folds);
  767. mem_free(recs);
  768. return;
  769. }
  770. block->is_hashed = TRUE;
  771. block->n_hash_helps = 0;
  772. block->curr_n_fields = n_fields;
  773. block->curr_n_bytes = n_bytes;
  774. block->curr_side = side;
  775. for (i = 0; i < n_cached; i++) {
  776. ha_insert_for_fold(table, folds[i], recs[i]);
  777. }
  778. rw_lock_x_unlock(&btr_search_latch);
  779. mem_free(folds);
  780. mem_free(recs);
  781. }
  782. /************************************************************************
  783. Moves or deletes hash entries for moved records. If new_page is already hashed,
  784. then the hash index for page, if any, is dropped. If new_page is not hashed,
  785. and page is hashed, then a new hash index is built to new_page with the same
  786. parameters as page (this often happens when a page is split). */
  787. void
  788. btr_search_move_or_delete_hash_entries(
  789. /*===================================*/
  790. page_t* new_page, /* in: records are copied to this page */
  791. page_t* page) /* in: index page from which records were
  792. copied, and the copied records will be deleted
  793. from this page */
  794. {
  795. buf_block_t* block;
  796. buf_block_t* new_block;
  797. ulint n_fields;
  798. ulint n_bytes;
  799. ulint side;
  800. block = buf_block_align(page);
  801. new_block = buf_block_align(new_page);
  802. ut_ad(rw_lock_own(&(block->lock), RW_LOCK_EX)
  803. && rw_lock_own(&(new_block->lock), RW_LOCK_EX));
  804. rw_lock_s_lock(&btr_search_latch);
  805. if (new_block->is_hashed) {
  806. rw_lock_s_unlock(&btr_search_latch);
  807. btr_search_drop_page_hash_index(page);
  808. return;
  809. }
  810. if (block->is_hashed) {
  811. n_fields = block->curr_n_fields;
  812. n_bytes = block->curr_n_bytes;
  813. side = block->curr_side;
  814. new_block->n_fields = block->curr_n_fields;
  815. new_block->n_bytes = block->curr_n_bytes;
  816. new_block->side = block->curr_side;
  817. rw_lock_s_unlock(&btr_search_latch);
  818. btr_search_build_page_hash_index(new_page, n_fields, n_bytes,
  819. side);
  820. ut_a(n_fields == block->curr_n_fields);
  821. ut_a(n_bytes == block->curr_n_bytes);
  822. ut_a(side == block->curr_side);
  823. return;
  824. }
  825. rw_lock_s_unlock(&btr_search_latch);
  826. }
  827. /************************************************************************
  828. Updates the page hash index when a single record is deleted from a page. */
  829. void
  830. btr_search_update_hash_on_delete(
  831. /*=============================*/
  832. btr_cur_t* cursor) /* in: cursor which was positioned on the
  833. record to delete using btr_cur_search_...,
  834. the record is not yet deleted */
  835. {
  836. hash_table_t* table;
  837. buf_block_t* block;
  838. rec_t* rec;
  839. ulint fold;
  840. dulint tree_id;
  841. ibool found;
  842. rec = btr_cur_get_rec(cursor);
  843. block = buf_block_align(rec);
  844. ut_ad(rw_lock_own(&(block->lock), RW_LOCK_EX));
  845. if (!block->is_hashed) {
  846. return;
  847. }
  848. table = btr_search_sys->hash_index;
  849. tree_id = ((cursor->index)->tree)->id;
  850. fold = rec_fold(rec, block->curr_n_fields, block->curr_n_bytes,
  851. tree_id);
  852. rw_lock_x_lock(&btr_search_latch);
  853. found = ha_search_and_delete_if_found(table, fold, rec);
  854. rw_lock_x_unlock(&btr_search_latch);
  855. }
  856. /************************************************************************
  857. Updates the page hash index when a single record is inserted on a page. */
  858. void
  859. btr_search_update_hash_node_on_insert(
  860. /*==================================*/
  861. btr_cur_t* cursor) /* in: cursor which was positioned to the
  862. place to insert using btr_cur_search_...,
  863. and the new record has been inserted next
  864. to the cursor */
  865. {
  866. hash_table_t* table;
  867. buf_block_t* block;
  868. rec_t* rec;
  869. rec = btr_cur_get_rec(cursor);
  870. block = buf_block_align(rec);
  871. ut_ad(rw_lock_own(&(block->lock), RW_LOCK_EX));
  872. if (!block->is_hashed) {
  873. return;
  874. }
  875. rw_lock_x_lock(&btr_search_latch);
  876. if ((cursor->flag == BTR_CUR_HASH)
  877.     && (cursor->n_fields == block->curr_n_fields)
  878.     && (cursor->n_bytes == block->curr_n_bytes)
  879.     && (block->curr_side == BTR_SEARCH_RIGHT_SIDE)) {
  880.      table = btr_search_sys->hash_index;
  881.     
  882.      ha_search_and_update_if_found(table, cursor->fold, rec,
  883. page_rec_get_next(rec));
  884. rw_lock_x_unlock(&btr_search_latch);
  885. } else {
  886. rw_lock_x_unlock(&btr_search_latch);
  887. btr_search_update_hash_on_insert(cursor);
  888. }
  889. }
  890. /************************************************************************
  891. Updates the page hash index when a single record is inserted on a page. */
  892. void
  893. btr_search_update_hash_on_insert(
  894. /*=============================*/
  895. btr_cur_t* cursor) /* in: cursor which was positioned to the
  896. place to insert using btr_cur_search_...,
  897. and the new record has been inserted next
  898. to the cursor */
  899. {
  900. hash_table_t* table; 
  901. buf_block_t* block;
  902. page_t* page;
  903. rec_t* rec;
  904. rec_t* ins_rec;
  905. rec_t* next_rec;
  906. dulint tree_id;
  907. ulint fold;
  908. ulint ins_fold;
  909. ulint next_fold;
  910. ulint n_fields;
  911. ulint n_bytes;
  912. ulint side;
  913. ibool locked = FALSE;
  914. table = btr_search_sys->hash_index;
  915. btr_search_check_free_space_in_heap();
  916. rec = btr_cur_get_rec(cursor);
  917. block = buf_block_align(rec);
  918. ut_ad(rw_lock_own(&(block->lock), RW_LOCK_EX));
  919. if (!block->is_hashed) {
  920. return;
  921. }
  922. tree_id = ((cursor->index)->tree)->id;
  923. n_fields = block->curr_n_fields;
  924. n_bytes = block->curr_n_bytes;
  925. side = block->curr_side;
  926. ins_rec = page_rec_get_next(rec);
  927. next_rec = page_rec_get_next(ins_rec);
  928. page = buf_frame_align(rec);
  929. ins_fold = rec_fold(ins_rec, n_fields, n_bytes, tree_id);
  930. if (next_rec != page_get_supremum_rec(page)) {
  931. next_fold = rec_fold(next_rec, n_fields, n_bytes, tree_id);
  932. }
  933. if (rec != page_get_infimum_rec(page)) {
  934. fold = rec_fold(rec, n_fields, n_bytes, tree_id);
  935. } else {
  936. if (side == BTR_SEARCH_LEFT_SIDE) {
  937. rw_lock_x_lock(&btr_search_latch);
  938. locked = TRUE;
  939. ha_insert_for_fold(table, ins_fold, ins_rec);
  940. }
  941. goto check_next_rec;
  942. }
  943.   if (fold != ins_fold) {
  944.   if (!locked) {
  945. rw_lock_x_lock(&btr_search_latch);
  946. locked = TRUE;
  947. }
  948. if (side == BTR_SEARCH_RIGHT_SIDE) {
  949. ha_insert_for_fold(table, fold, rec);
  950. } else {
  951. ha_insert_for_fold(table, ins_fold, ins_rec);
  952. }
  953. }
  954. check_next_rec:
  955. if (next_rec == page_get_supremum_rec(page)) {
  956. if (side == BTR_SEARCH_RIGHT_SIDE) {
  957.   if (!locked) {
  958. rw_lock_x_lock(&btr_search_latch);
  959. locked = TRUE;
  960. }
  961. ha_insert_for_fold(table, ins_fold, ins_rec);
  962. }
  963. goto function_exit;
  964. }
  965. if (ins_fold != next_fold) {
  966.   if (!locked) {
  967. rw_lock_x_lock(&btr_search_latch);
  968. locked = TRUE;
  969. }
  970. if (side == BTR_SEARCH_RIGHT_SIDE) {
  971. ha_insert_for_fold(table, ins_fold, ins_rec);
  972. /*
  973. printf("Hash insert for %s, fold %lun",
  974. cursor->index->name, ins_fold);
  975. */
  976. } else {
  977. ha_insert_for_fold(table, next_fold, next_rec);
  978. }
  979. }
  980. function_exit:
  981. if (locked) {
  982. rw_lock_x_unlock(&btr_search_latch);
  983. }
  984. }
  985. /************************************************************************
  986. Prints info of the search system. */
  987. void
  988. btr_search_print_info(void)
  989. /*=======================*/
  990. {
  991. printf("SEARCH SYSTEM INFOn");
  992. rw_lock_x_lock(&btr_search_latch);
  993. ha_print_info(btr_search_sys->hash_index);
  994. rw_lock_x_unlock(&btr_search_latch);
  995. }
  996. /************************************************************************
  997. Prints info of searches on an index. */
  998. void
  999. btr_search_index_print_info(
  1000. /*========================*/
  1001. dict_index_t* index) /* in: index */
  1002. {
  1003. btr_search_t* info;
  1004. printf("INDEX SEARCH INFOn");
  1005. rw_lock_x_lock(&btr_search_latch);
  1006. info = btr_search_get_info(index);
  1007. printf("Searches %lu, hash succ %lu, fail %lu, patt succ %lun",
  1008. info->n_searches, info->n_hash_succ, info->n_hash_fail,
  1009. info->n_patt_succ);
  1010. printf("Total of page cur short succ for all indexes %lun",
  1011. page_cur_short_succ);
  1012. rw_lock_x_unlock(&btr_search_latch);
  1013. }
  1014. /************************************************************************
  1015. Prints info of searches on a table. */
  1016. void
  1017. btr_search_table_print_info(
  1018. /*========================*/
  1019. char* name) /* in: table name */
  1020. {
  1021. dict_table_t* table;
  1022. dict_index_t* index;
  1023. mutex_enter(&(dict_sys->mutex));
  1024. table = dict_table_get_low(name);
  1025. ut_a(table);
  1026. mutex_exit(&(dict_sys->mutex));
  1027. index = dict_table_get_first_index(table);
  1028. while (index) {
  1029. btr_search_index_print_info(index);
  1030. index = dict_table_get_next_index(index);
  1031. }
  1032. }
  1033. /************************************************************************
  1034. Validates the search system. */
  1035. ibool
  1036. btr_search_validate(void)
  1037. /*=====================*/
  1038. /* out: TRUE if ok */
  1039. {
  1040. rw_lock_x_lock(&btr_search_latch);
  1041. ut_a(ha_validate(btr_search_sys->hash_index));
  1042. rw_lock_x_unlock(&btr_search_latch);
  1043. return(TRUE);
  1044. }