toom6_sqr.c
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:5k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. /* Implementation of the squaring algorithm with Toom-Cook 6.5-way.
  2.    Contributed to the GNU project by Marco Bodrato.
  3.    THE FUNCTION IN THIS FILE IS INTERNAL WITH A MUTABLE INTERFACE.  IT IS ONLY
  4.    SAFE TO REACH IT THROUGH DOCUMENTED INTERFACES.  IN FACT, IT IS ALMOST
  5.    GUARANTEED THAT IT WILL CHANGE OR DISAPPEAR IN A FUTURE GNU MP RELEASE.
  6. Copyright 2009 Free Software Foundation, Inc.
  7. This file is part of the GNU MP Library.
  8. The GNU MP Library is free software; you can redistribute it and/or modify
  9. it under the terms of the GNU Lesser General Public License as published by
  10. the Free Software Foundation; either version 3 of the License, or (at your
  11. option) any later version.
  12. The GNU MP Library is distributed in the hope that it will be useful, but
  13. WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  14. or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  15. License for more details.
  16. You should have received a copy of the GNU Lesser General Public License
  17. along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
  18. #include "gmp.h"
  19. #include "gmp-impl.h"
  20. #if GMP_NUMB_BITS < 21
  21. #error Not implemented.
  22. #endif
  23. #if TUNE_PROGRAM_BUILD
  24. #define MAYBE_sqr_basecase 1
  25. #define MAYBE_sqr_above_basecase   1
  26. #define MAYBE_sqr_toom2   1
  27. #define MAYBE_sqr_above_toom2   1
  28. #define MAYBE_sqr_toom3   1
  29. #define MAYBE_sqr_above_toom3   1
  30. #define MAYBE_sqr_above_toom4   1
  31. #else
  32. #ifdef  SQR_TOOM8_THRESHOLD
  33. #define SQR_TOOM6_MAX ((SQR_TOOM8_THRESHOLD+6*2-1+5)/6)
  34. #else
  35. #define SQR_TOOM6_MAX
  36.   ((SQR_FFT_THRESHOLD <= MP_SIZE_T_MAX - (6*2-1+5)) ?
  37.    ((SQR_FFT_THRESHOLD+6*2-1+5)/6)
  38.    : MP_SIZE_T_MAX )
  39. #endif
  40. #define MAYBE_sqr_basecase
  41.   (SQR_TOOM6_THRESHOLD < 6 * SQR_TOOM2_THRESHOLD)
  42. #define MAYBE_sqr_above_basecase
  43.   (SQR_TOOM6_MAX >=  SQR_TOOM2_THRESHOLD)
  44. #define MAYBE_sqr_toom2
  45.   (SQR_TOOM6_THRESHOLD < 6 * SQR_TOOM3_THRESHOLD)
  46. #define MAYBE_sqr_above_toom2
  47.   (SQR_TOOM6_MAX >= SQR_TOOM3_THRESHOLD)
  48. #define MAYBE_sqr_toom3
  49.   (SQR_TOOM6_THRESHOLD < 6 * SQR_TOOM4_THRESHOLD)
  50. #define MAYBE_sqr_above_toom3
  51.   (SQR_TOOM6_MAX >= SQR_TOOM4_THRESHOLD)
  52. #define MAYBE_sqr_above_toom4
  53.   (SQR_TOOM6_MAX >= SQR_TOOM6_THRESHOLD)
  54. #endif
  55. #define TOOM6_SQR_REC(p, a, n, ws)
  56.   do {
  57.     if (MAYBE_sqr_basecase && ( !MAYBE_sqr_above_basecase
  58. || BELOW_THRESHOLD (n, SQR_TOOM2_THRESHOLD)))
  59.       mpn_sqr_basecase (p, a, n);
  60.     else if (MAYBE_sqr_toom2 && ( !MAYBE_sqr_above_toom2
  61.      || BELOW_THRESHOLD (n, SQR_TOOM3_THRESHOLD)))
  62.       mpn_toom2_sqr (p, a, n, ws);
  63.     else if (MAYBE_sqr_toom3 && ( !MAYBE_sqr_above_toom3
  64.      || BELOW_THRESHOLD (n, SQR_TOOM4_THRESHOLD)))
  65.       mpn_toom3_sqr (p, a, n, ws);
  66.     else if (! MAYBE_sqr_above_toom4
  67.      || BELOW_THRESHOLD (n, SQR_TOOM6_THRESHOLD))
  68.       mpn_toom4_sqr (p, a, n, ws);
  69.     else
  70.       mpn_toom6_sqr (p, a, n, ws);
  71.   } while (0)
  72. void
  73. mpn_toom6_sqr  (mp_ptr pp, mp_srcptr ap, mp_size_t an, mp_ptr scratch)
  74. {
  75.   mp_size_t n, s;
  76.   /***************************** decomposition *******************************/
  77.   ASSERT( an >= 18 );
  78.   n = 1 + (an - 1) / (size_t) 6;
  79.   s = an - 5 * n;
  80.   ASSERT (0 < s && s <= n);
  81. #define   r4    (pp + 3 * n) /* 3n+1 */
  82. #define   r2    (pp + 7 * n) /* 3n+1 */
  83. #define   r0    (pp +11 * n) /* s+t <= 2*n */
  84. #define   r5    (scratch) /* 3n+1 */
  85. #define   r3    (scratch + 3 * n + 1) /* 3n+1 */
  86. #define   r1    (scratch + 6 * n + 2) /* 3n+1 */
  87. #define   v0    (pp + 7 * n) /* n+1 */
  88. #define   v2    (pp + 9 * n+2) /* n+1 */
  89. #define   wse   (scratch + 9 * n + 3) /* 3n+1 */
  90.   /* Alloc also 3n+1 limbs for ws... toom_interpolate_12pts may
  91.      need all of them, when DO_mpn_sublsh_n usea a scratch  */
  92. /*   if (scratch== NULL) */
  93. /*     scratch = TMP_SALLOC_LIMBS (12 * n + 6); */
  94.   /********************** evaluation and recursive calls *********************/
  95.   /* $pm1/2$ */
  96.   mpn_toom_eval_pm2rexp (v2, v0, 5, ap, n, s, 1, pp);
  97.   TOOM6_SQR_REC(pp, v0, n + 1, wse); /* A(-1/2)*B(-1/2)*2^. */
  98.   TOOM6_SQR_REC(r5, v2, n + 1, wse); /* A(+1/2)*B(+1/2)*2^. */
  99.   mpn_toom_couple_handling (r5, 2 * n + 1, pp, 0, n, 1, 0);
  100.   /* $pm1$ */
  101.   mpn_toom_eval_pm1 (v2, v0, 5, ap, n, s,    pp);
  102.   TOOM6_SQR_REC(pp, v0, n + 1, wse); /* A(-1)*B(-1) */
  103.   TOOM6_SQR_REC(r3, v2, n + 1, wse); /* A(1)*B(1) */
  104.   mpn_toom_couple_handling (r3, 2 * n + 1, pp, 0, n, 0, 0);
  105.   /* $pm4$ */
  106.   mpn_toom_eval_pm2exp (v2, v0, 5, ap, n, s, 2, pp);
  107.   TOOM6_SQR_REC(pp, v0, n + 1, wse); /* A(-4)*B(-4) */
  108.   TOOM6_SQR_REC(r1, v2, n + 1, wse); /* A(+4)*B(+4) */
  109.   mpn_toom_couple_handling (r1, 2 * n + 1, pp, 0, n, 2, 4);
  110.   /* $pm1/4$ */
  111.   mpn_toom_eval_pm2rexp (v2, v0, 5, ap, n, s, 2, pp);
  112.   TOOM6_SQR_REC(pp, v0, n + 1, wse); /* A(-1/4)*B(-1/4)*4^. */
  113.   TOOM6_SQR_REC(r4, v2, n + 1, wse); /* A(+1/4)*B(+1/4)*4^. */
  114.   mpn_toom_couple_handling (r4, 2 * n + 1, pp, 0, n, 2, 0);
  115.   /* $pm2$ */
  116.   mpn_toom_eval_pm2 (v2, v0, 5, ap, n, s, pp);
  117.   TOOM6_SQR_REC(pp, v0, n + 1, wse); /* A(-2)*B(-2) */
  118.   TOOM6_SQR_REC(r2, v2, n + 1, wse); /* A(+2)*B(+2) */
  119.   mpn_toom_couple_handling (r2, 2 * n + 1, pp, 0, n, 1, 2);
  120. #undef v0
  121. #undef v2
  122.   /* A(0)*B(0) */
  123.   TOOM6_SQR_REC(pp, ap, n, wse);
  124.   mpn_toom_interpolate_12pts (pp, r1, r3, r5, n, 2 * s, 0, wse);
  125. #undef r0
  126. #undef r1
  127. #undef r2
  128. #undef r3
  129. #undef r4
  130. #undef r5
  131. }
  132. #undef TOOM6_SQR_REC
  133. #undef MAYBE_sqr_basecase
  134. #undef MAYBE_sqr_above_basecase
  135. #undef MAYBE_sqr_toom2
  136. #undef MAYBE_sqr_above_toom2
  137. #undef MAYBE_sqr_toom3
  138. #undef MAYBE_sqr_above_toom3
  139. #undef MAYBE_sqr_above_toom4