mul_1.asm
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:2k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. dnl  PowerPC-32 mpn_mul_1 -- Multiply a limb vector with a limb and store the
  2. dnl  result in a second limb vector.
  3. dnl  Copyright 1995, 1997, 2000, 2002, 2003, 2005 Free Software Foundation,
  4. dnl  Inc.
  5. dnl  This file is part of the GNU MP Library.
  6. dnl  The GNU MP Library is free software; you can redistribute it and/or modify
  7. dnl  it under the terms of the GNU Lesser General Public License as published
  8. dnl  by the Free Software Foundation; either version 3 of the License, or (at
  9. dnl  your option) any later version.
  10. dnl  The GNU MP Library is distributed in the hope that it will be useful, but
  11. dnl  WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  12. dnl  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  13. dnl  License for more details.
  14. dnl  You should have received a copy of the GNU Lesser General Public License
  15. dnl  along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.
  16. include(`../config.m4')
  17. C                cycles/limb
  18. C 603e:            ?
  19. C 604e:            4.0
  20. C 75x (G3):        4.5-11
  21. C 7400,7410 (G4):  4.5-11
  22. C 744x,745x (G4+): 6.0
  23. C power4/ppc970:   6.0
  24. C power5:          5.63
  25. C INPUT PARAMETERS
  26. C rp r3
  27. C up r4
  28. C n r5
  29. C vl r6
  30. ASM_START()
  31. PROLOGUE(mpn_mul_1)
  32. mtctr r5
  33. addi r3,r3,-4 C adjust res_ptr, it's offset before it's used
  34. li r12,0 C clear upper product reg
  35. addic r0,r0,0 C clear cy
  36. C Start software pipeline
  37. lwz r8,0(r4)
  38. bdz L(end3)
  39. lwzu r9,4(r4)
  40. mullw r11,r8,r6
  41. mulhwu r0,r8,r6
  42. bdz L(end1)
  43. C Software pipelined main loop
  44. L(loop):
  45. lwz r8,4(r4)
  46. mullw r10,r9,r6
  47. adde r5,r11,r12
  48. mulhwu r12,r9,r6
  49. stw r5,4(r3)
  50. bdz L(end2)
  51. lwzu r9,8(r4)
  52. mullw r11,r8,r6
  53. adde r7,r10,r0
  54. mulhwu r0,r8,r6
  55. stwu r7,8(r3)
  56. bdnz L(loop)
  57. C Finish software pipeline
  58. L(end1):
  59. mullw r10,r9,r6
  60. adde r5,r11,r12
  61. mulhwu r12,r9,r6
  62. stw r5,4(r3)
  63. adde r7,r10,r0
  64. stwu r7,8(r3)
  65. addze r3,r12
  66. blr
  67. L(end2):
  68. mullw r11,r8,r6
  69. adde r7,r10,r0
  70. mulhwu r0,r8,r6
  71. stwu r7,8(r3)
  72. adde r5,r11,r12
  73. stw r5,4(r3)
  74. addze r3,r0
  75. blr
  76. L(end3):
  77. mullw r11,r8,r6
  78. stw r11,4(r3)
  79. mulhwu r3,r8,r6
  80. blr
  81. EPILOGUE(mpn_mul_1)