rshift.asm
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:2k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. dnl  PowerPC 750 mpn_rshift -- mpn right shift.
  2. dnl  Copyright 2002, 2003 Free Software Foundation, Inc.
  3. dnl  This file is part of the GNU MP Library.
  4. dnl  The GNU MP Library is free software; you can redistribute it and/or modify
  5. dnl  it under the terms of the GNU Lesser General Public License as published
  6. dnl  by the Free Software Foundation; either version 3 of the License, or (at
  7. dnl  your option) any later version.
  8. dnl  The GNU MP Library is distributed in the hope that it will be useful, but
  9. dnl  WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  10. dnl  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  11. dnl  License for more details.
  12. dnl  You should have received a copy of the GNU Lesser General Public License
  13. dnl  along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.
  14. include(`../config.m4')
  15. C       cycles/limb
  16. C 750:     3.0
  17. C 7400:    3.0
  18. C mp_limb_t mpn_rshift (mp_ptr dst, mp_srcptr src, mp_size_t size,
  19. C                       unsigned shift);
  20. C
  21. C This code is the same per-limb speed as mpn/powerpc32/rshift.asm, but
  22. C smaller and saving about 30 or so cycles of overhead.
  23. ASM_START()
  24. PROLOGUE(mpn_rshift)
  25. C r3 dst
  26. C r4 src
  27. C r5 size
  28. C r6 shift
  29. mtctr r5 C size
  30. lwz r8, 0(r4) C src[0]
  31. subfic r7, r6, 32 C 32-shift
  32. addi r5, r3, -4 C dst-4
  33. slw r3, r8, r7 C return value
  34. bdz L(one)
  35. lwzu r9, 4(r4) C src[1]
  36. srw r8, r8, r6 C src[0] >> shift
  37. bdz L(two)
  38. L(top):
  39. C r3 return value
  40. C r4 src, incrementing
  41. C r5 dst, incrementing
  42. C r6 shift
  43. C r7 32-shift
  44. C r8 src[i-1] >> shift
  45. C r9 src[i]
  46. C r10
  47. lwzu r10, 4(r4)
  48. slw r11, r9, r7
  49. or r8, r8, r11
  50. stwu r8, 4(r5)
  51. srw r8, r9, r6
  52. bdz L(odd)
  53. C r8 src[i-1] >> shift
  54. C r9
  55. C r10 src[i]
  56. lwzu r9, 4(r4)
  57. slw r11, r10, r7
  58. or r8, r8, r11
  59. stwu r8, 4(r5)
  60. srw r8, r10, r6
  61. bdnz L(top)
  62. L(two):
  63. C r3 return value
  64. C r4
  65. C r5 &dst[size-2]
  66. C r6 shift
  67. C r7 32-shift
  68. C r8 src[size-2] >> shift
  69. C r9 src[size-1]
  70. C r10
  71. slw r11, r9, r7
  72. srw r12, r9, r6 C src[size-1] >> shift
  73. or r8, r8, r11
  74. stw r12, 8(r5) C dst[size-1]
  75. stw r8, 4(r5) C dst[size-2]
  76. blr
  77. L(odd):
  78. C r3 return value
  79. C r4
  80. C r5 &dst[size-2]
  81. C r6 shift
  82. C r7 32-shift
  83. C r8 src[size-2] >> shift
  84. C r9
  85. C r10 src[size-1]
  86. slw r11, r10, r7
  87. srw r12, r10, r6
  88. or r8, r8, r11
  89. stw r12, 8(r5) C dst[size-1]
  90. stw r8, 4(r5) C dst[size-2]
  91. blr
  92. L(one):
  93. C r3 return value
  94. C r4
  95. C r5 dst-4
  96. C r6 shift
  97. C r7
  98. C r8 src[0]
  99. srw r8, r8, r6
  100. stw r8, 4(r5) C dst[0]
  101. blr
  102. EPILOGUE(mpn_rshift)