dcpi1_bdiv_qr.c
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:4k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. /* mpn_dcpi1_bdiv_qr -- divide-and-conquer Hensel division with precomputed
  2.    inverse, returning quotient and remainder.
  3.    Contributed to the GNU project by Niels M鰈ler and Torbjorn Granlund.
  4.    THE FUNCTIONS IN THIS FILE ARE INTERNAL WITH MUTABLE INTERFACES.  IT IS ONLY
  5.    SAFE TO REACH THEM THROUGH DOCUMENTED INTERFACES.  IN FACT, IT IS ALMOST
  6.    GUARANTEED THAT THEY WILL CHANGE OR DISAPPEAR IN A FUTURE GMP RELEASE.
  7. Copyright 2006, 2007, 2009, 2010 Free Software Foundation, Inc.
  8. This file is part of the GNU MP Library.
  9. The GNU MP Library is free software; you can redistribute it and/or modify
  10. it under the terms of the GNU Lesser General Public License as published by
  11. the Free Software Foundation; either version 3 of the License, or (at your
  12. option) any later version.
  13. The GNU MP Library is distributed in the hope that it will be useful, but
  14. WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  15. or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  16. License for more details.
  17. You should have received a copy of the GNU Lesser General Public License
  18. along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.  */
  19. #include "gmp.h"
  20. #include "gmp-impl.h"
  21. /* Computes Hensel binary division of {np, 2*n} by {dp, n}.
  22.    Output:
  23.       q = n * d^{-1} mod 2^{qn * GMP_NUMB_BITS},
  24.       r = (n - q * d) * 2^{-qn * GMP_NUMB_BITS}
  25.    Stores q at qp. Stores the n least significant limbs of r at the high half
  26.    of np, and returns the borrow from the subtraction n - q*d.
  27.    d must be odd. dinv is (-d)^-1 mod 2^GMP_NUMB_BITS. */
  28. mp_size_t
  29. mpn_dcpi1_bdiv_qr_n_itch (mp_size_t n)
  30. {
  31.   return n;
  32. }
  33. mp_limb_t
  34. mpn_dcpi1_bdiv_qr_n (mp_ptr qp, mp_ptr np, mp_srcptr dp, mp_size_t n,
  35.      mp_limb_t dinv, mp_ptr tp)
  36. {
  37.   mp_size_t lo, hi;
  38.   mp_limb_t cy;
  39.   mp_limb_t rh;
  40.   lo = n >> 1; /* floor(n/2) */
  41.   hi = n - lo; /* ceil(n/2) */
  42.   if (BELOW_THRESHOLD (lo, DC_BDIV_QR_THRESHOLD))
  43.     cy = mpn_sbpi1_bdiv_qr (qp, np, 2 * lo, dp, lo, dinv);
  44.   else
  45.     cy = mpn_dcpi1_bdiv_qr_n (qp, np, dp, lo, dinv, tp);
  46.   mpn_mul (tp, dp + lo, hi, qp, lo);
  47.   mpn_incr_u (tp + lo, cy);
  48.   rh = mpn_sub (np + lo, np + lo, n + hi, tp, n);
  49.   if (BELOW_THRESHOLD (hi, DC_BDIV_QR_THRESHOLD))
  50.     cy = mpn_sbpi1_bdiv_qr (qp + lo, np + lo, 2 * hi, dp, hi, dinv);
  51.   else
  52.     cy = mpn_dcpi1_bdiv_qr_n (qp + lo, np + lo, dp, hi, dinv, tp);
  53.   mpn_mul (tp, qp + lo, hi, dp + hi, lo);
  54.   mpn_incr_u (tp + hi, cy);
  55.   rh += mpn_sub_n (np + n, np + n, tp, n);
  56.   return rh;
  57. }
  58. mp_limb_t
  59. mpn_dcpi1_bdiv_qr (mp_ptr qp, mp_ptr np, mp_size_t nn,
  60.    mp_srcptr dp, mp_size_t dn, mp_limb_t dinv)
  61. {
  62.   mp_size_t qn;
  63.   mp_limb_t rr, cy;
  64.   mp_ptr tp;
  65.   TMP_DECL;
  66.   TMP_MARK;
  67.   ASSERT (dn >= 2); /* to adhere to mpn_sbpi1_div_qr's limits */
  68.   ASSERT (nn - dn >= 1); /* to adhere to mpn_sbpi1_div_qr's limits */
  69.   ASSERT (dp[0] & 1);
  70.   tp = TMP_SALLOC_LIMBS (dn);
  71.   qn = nn - dn;
  72.   if (qn > dn)
  73.     {
  74.       /* Reduce qn mod dn without division, optimizing small operations.  */
  75.       do
  76. qn -= dn;
  77.       while (qn > dn);
  78.       /* Perform the typically smaller block first.  */
  79.       if (BELOW_THRESHOLD (qn, DC_BDIV_QR_THRESHOLD))
  80. cy = mpn_sbpi1_bdiv_qr (qp, np, 2 * qn, dp, qn, dinv);
  81.       else
  82. cy = mpn_dcpi1_bdiv_qr_n (qp, np, dp, qn, dinv, tp);
  83.       rr = 0;
  84.       if (qn != dn)
  85. {
  86.   if (qn > dn - qn)
  87.     mpn_mul (tp, qp, qn, dp + qn, dn - qn);
  88.   else
  89.     mpn_mul (tp, dp + qn, dn - qn, qp, qn);
  90.   mpn_incr_u (tp + qn, cy);
  91.   rr = mpn_sub (np + qn, np + qn, nn - qn, tp, dn);
  92.   cy = 0;
  93. }
  94.       np += qn;
  95.       qp += qn;
  96.       qn = nn - dn - qn;
  97.       do
  98. {
  99.   rr += mpn_sub_1 (np + dn, np + dn, qn, cy);
  100.   cy = mpn_dcpi1_bdiv_qr_n (qp, np, dp, dn, dinv, tp);
  101.   qp += dn;
  102.   np += dn;
  103.   qn -= dn;
  104. }
  105.       while (qn > 0);
  106.       TMP_FREE;
  107.       return rr + cy;
  108.     }
  109.   if (BELOW_THRESHOLD (qn, DC_BDIV_QR_THRESHOLD))
  110.     cy = mpn_sbpi1_bdiv_qr (qp, np, 2 * qn, dp, qn, dinv);
  111.   else
  112.     cy = mpn_dcpi1_bdiv_qr_n (qp, np, dp, qn, dinv, tp);
  113.   rr = 0;
  114.   if (qn != dn)
  115.     {
  116.       if (qn > dn - qn)
  117. mpn_mul (tp, qp, qn, dp + qn, dn - qn);
  118.       else
  119. mpn_mul (tp, dp + qn, dn - qn, qp, qn);
  120.       mpn_incr_u (tp + qn, cy);
  121.       rr = mpn_sub (np + qn, np + qn, nn - qn, tp, dn);
  122.       cy = 0;
  123.     }
  124.   TMP_FREE;
  125.   return rr + cy;
  126. }