lshift.asm
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:3k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. dnl  SPARC v9 mpn_lshift
  2. dnl  Copyright 1996, 2000, 2001, 2002, 2003 Free Software Foundation, Inc.
  3. dnl  This file is part of the GNU MP Library.
  4. dnl  The GNU MP Library is free software; you can redistribute it and/or modify
  5. dnl  it under the terms of the GNU Lesser General Public License as published
  6. dnl  by the Free Software Foundation; either version 3 of the License, or (at
  7. dnl  your option) any later version.
  8. dnl  The GNU MP Library is distributed in the hope that it will be useful, but
  9. dnl  WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  10. dnl  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  11. dnl  License for more details.
  12. dnl  You should have received a copy of the GNU Lesser General Public License
  13. dnl  along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.
  14. include(`../config.m4')
  15. C    cycles/limb
  16. C UltraSPARC 1&2:     2
  17. C UltraSPARC 3:       3.25
  18. C INPUT PARAMETERS
  19. define(`rp',`%i0')
  20. define(`up',`%i1')
  21. define(`n',`%i2')
  22. define(`cnt',`%i3')
  23. define(`u0',`%l0')
  24. define(`u1',`%l2')
  25. define(`u2',`%l4')
  26. define(`u3',`%l6')
  27. define(`tnc',`%i4')
  28. define(`fanop',`fitod %f0,%f2') dnl  A quasi nop running in the FA pipe
  29. define(`fmnop',`fmuld %f0,%f0,%f4') dnl  A quasi nop running in the FM pipe
  30. ASM_START()
  31. REGISTER(%g2,#scratch)
  32. REGISTER(%g3,#scratch)
  33. PROLOGUE(mpn_lshift)
  34. save %sp,-160,%sp
  35. sllx n,3,%g1
  36. sub %g0,cnt,tnc C negate shift count
  37. add up,%g1,up C make %o1 point at end of src
  38. add rp,%g1,rp C make %o0 point at end of res
  39. ldx [up-8],u3 C load first limb
  40. subcc n,5,n
  41. srlx u3,tnc,%i5 C compute function result
  42. sllx u3,cnt,%g3
  43. bl,pn %icc,.Lend1234
  44. fanop
  45. subcc n,4,n
  46. ldx [up-16],u0
  47. ldx [up-24],u1
  48. add up,-32,up
  49. ldx [up-0],u2
  50. ldx [up-8],u3
  51. srlx u0,tnc,%g2
  52. bl,pn %icc,.Lend5678
  53. fanop
  54. b,a .Loop
  55. .align 16
  56. .Loop:
  57. sllx u0,cnt,%g1
  58. or %g3,%g2,%g3
  59. ldx [up-16],u0
  60. fanop
  61. C --
  62. srlx u1,tnc,%g2
  63. subcc n,4,n
  64. stx %g3,[rp-8]
  65. fanop
  66. C --
  67. sllx u1,cnt,%g3
  68. or %g1,%g2,%g1
  69. ldx [up-24],u1
  70. fanop
  71. C --
  72. srlx u2,tnc,%g2
  73. stx %g1,[rp-16]
  74. add up,-32,up
  75. fanop
  76. C --
  77. sllx u2,cnt,%g1
  78. or %g3,%g2,%g3
  79. ldx [up-0],u2
  80. fanop
  81. C --
  82. srlx u3,tnc,%g2
  83. stx %g3,[rp-24]
  84. add rp,-32,rp
  85. fanop
  86. C --
  87. sllx u3,cnt,%g3
  88. or %g1,%g2,%g1
  89. ldx [up-8],u3
  90. fanop
  91. C --
  92. srlx u0,tnc,%g2
  93. stx %g1,[rp-0]
  94. bge,pt %icc,.Loop
  95. fanop
  96. C --
  97. .Lend5678:
  98. sllx u0,cnt,%g1
  99. or %g3,%g2,%g3
  100. srlx u1,tnc,%g2
  101. stx %g3,[rp-8]
  102. sllx u1,cnt,%g3
  103. or %g1,%g2,%g1
  104. srlx u2,tnc,%g2
  105. stx %g1,[rp-16]
  106. sllx u2,cnt,%g1
  107. or %g3,%g2,%g3
  108. srlx u3,tnc,%g2
  109. stx %g3,[rp-24]
  110. add rp,-32,rp
  111. sllx u3,cnt,%g3 C carry...
  112. or %g1,%g2,%g1
  113. stx %g1,[rp-0]
  114. .Lend1234:
  115. addcc n,4,n
  116. bz,pn %icc,.Lret
  117. fanop
  118. .Loop0:
  119. add rp,-8,rp
  120. subcc n,1,n
  121. ldx [up-16],u3
  122. add up,-8,up
  123. srlx u3,tnc,%g2
  124. or %g3,%g2,%g3
  125. stx %g3,[rp]
  126. sllx u3,cnt,%g3
  127. bnz,pt %icc,.Loop0
  128. fanop
  129. .Lret:
  130. stx %g3,[rp-8]
  131. mov %i5,%i0
  132. ret
  133. restore
  134. EPILOGUE(mpn_lshift)