rshift.asm
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:3k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. dnl  SPARC v9 mpn_rshift
  2. dnl  Copyright 1996, 2000, 2001, 2002, 2003 Free Software Foundation, Inc.
  3. dnl  This file is part of the GNU MP Library.
  4. dnl  The GNU MP Library is free software; you can redistribute it and/or modify
  5. dnl  it under the terms of the GNU Lesser General Public License as published
  6. dnl  by the Free Software Foundation; either version 3 of the License, or (at
  7. dnl  your option) any later version.
  8. dnl  The GNU MP Library is distributed in the hope that it will be useful, but
  9. dnl  WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  10. dnl  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  11. dnl  License for more details.
  12. dnl  You should have received a copy of the GNU Lesser General Public License
  13. dnl  along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.
  14. include(`../config.m4')
  15. C    cycles/limb
  16. C UltraSPARC 1&2:     2
  17. C UltraSPARC 3:       3.25
  18. C INPUT PARAMETERS
  19. define(`rp',`%i0')
  20. define(`up',`%i1')
  21. define(`n',`%i2')
  22. define(`cnt',`%i3')
  23. define(`u0',`%l0')
  24. define(`u1',`%l2')
  25. define(`u2',`%l4')
  26. define(`u3',`%l6')
  27. define(`tnc',`%i4')
  28. define(`fanop',`fitod %f0,%f2') dnl  A quasi nop running in the FA pipe
  29. define(`fmnop',`fmuld %f0,%f0,%f4') dnl  A quasi nop running in the FM pipe
  30. ASM_START()
  31. REGISTER(%g2,#scratch)
  32. REGISTER(%g3,#scratch)
  33. PROLOGUE(mpn_rshift)
  34. save %sp,-160,%sp
  35. sub %g0,cnt,tnc C negate shift count
  36. ldx [up],u3 C load first limb
  37. subcc n,5,n
  38. sllx u3,tnc,%i5 C compute function result
  39. srlx u3,cnt,%g3
  40. bl,pn %icc,.Lend1234
  41. fanop
  42. subcc n,4,n
  43. ldx [up+8],u0
  44. ldx [up+16],u1
  45. add up,32,up
  46. ldx [up-8],u2
  47. ldx [up+0],u3
  48. sllx u0,tnc,%g2
  49. bl,pn %icc,.Lend5678
  50. fanop
  51. b,a .Loop
  52. .align 16
  53. .Loop:
  54. srlx u0,cnt,%g1
  55. or %g3,%g2,%g3
  56. ldx [up+8],u0
  57. fanop
  58. C --
  59. sllx u1,tnc,%g2
  60. subcc n,4,n
  61. stx %g3,[rp+0]
  62. fanop
  63. C --
  64. srlx u1,cnt,%g3
  65. or %g1,%g2,%g1
  66. ldx [up+16],u1
  67. fanop
  68. C --
  69. sllx u2,tnc,%g2
  70. stx %g1,[rp+8]
  71. add up,32,up
  72. fanop
  73. C --
  74. srlx u2,cnt,%g1
  75. or %g3,%g2,%g3
  76. ldx [up-8],u2
  77. fanop
  78. C --
  79. sllx u3,tnc,%g2
  80. stx %g3,[rp+16]
  81. add rp,32,rp
  82. fanop
  83. C --
  84. srlx u3,cnt,%g3
  85. or %g1,%g2,%g1
  86. ldx [up+0],u3
  87. fanop
  88. C --
  89. sllx u0,tnc,%g2
  90. stx %g1,[rp-8]
  91. bge,pt %icc,.Loop
  92. fanop
  93. C --
  94. .Lend5678:
  95. srlx u0,cnt,%g1
  96. or %g3,%g2,%g3
  97. sllx u1,tnc,%g2
  98. stx %g3,[rp+0]
  99. srlx u1,cnt,%g3
  100. or %g1,%g2,%g1
  101. sllx u2,tnc,%g2
  102. stx %g1,[rp+8]
  103. srlx u2,cnt,%g1
  104. or %g3,%g2,%g3
  105. sllx u3,tnc,%g2
  106. stx %g3,[rp+16]
  107. add rp,32,rp
  108. srlx u3,cnt,%g3 C carry...
  109. or %g1,%g2,%g1
  110. stx %g1,[rp-8]
  111. .Lend1234:
  112. addcc n,4,n
  113. bz,pn %icc,.Lret
  114. fanop
  115. .Loop0:
  116. add rp,8,rp
  117. subcc n,1,n
  118. ldx [up+8],u3
  119. add up,8,up
  120. sllx u3,tnc,%g2
  121. or %g3,%g2,%g3
  122. stx %g3,[rp-8]
  123. srlx u3,cnt,%g3
  124. bnz,pt %icc,.Loop0
  125. fanop
  126. .Lret:
  127. stx %g3,[rp+0]
  128. mov %i5,%i0
  129. ret
  130. restore
  131. EPILOGUE(mpn_rshift)