lshift.asm
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:3k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. dnl  PowerPC 750 mpn_lshift -- mpn left shift.
  2. dnl  Copyright 2002, 2003 Free Software Foundation, Inc.
  3. dnl  This file is part of the GNU MP Library.
  4. dnl  The GNU MP Library is free software; you can redistribute it and/or modify
  5. dnl  it under the terms of the GNU Lesser General Public License as published
  6. dnl  by the Free Software Foundation; either version 3 of the License, or (at
  7. dnl  your option) any later version.
  8. dnl  The GNU MP Library is distributed in the hope that it will be useful, but
  9. dnl  WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  10. dnl  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  11. dnl  License for more details.
  12. dnl  You should have received a copy of the GNU Lesser General Public License
  13. dnl  along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.
  14. include(`../config.m4')
  15. C       cycles/limb
  16. C 750:     3.0
  17. C 7400:    3.0
  18. C mp_limb_t mpn_lshift (mp_ptr dst, mp_srcptr src, mp_size_t size,
  19. C                       unsigned shift);
  20. C
  21. C This code is the same per-limb speed as mpn/powerpc32/lshift.asm, but
  22. C smaller and saving about 30 or so cycles of overhead.
  23. ASM_START()
  24. PROLOGUE(mpn_lshift)
  25. C r3 dst
  26. C r4 src
  27. C r5 size
  28. C r6 shift
  29. mtctr r5 C size
  30. slwi r5, r5, 2 C 4*size
  31. subfic r7, r6, 32 C 32-shift
  32. add r4, r4, r5 C &src[size]
  33. add r5, r3, r5 C &dst[size]
  34. lwz r8, -4(r4) C src[size-1]
  35. bdz L(one)
  36. lwzu r9, -8(r4) C src[size-2]
  37. srw r3, r8, r7 C return value
  38. slw r8, r8, r6 C src[size-1] << shift
  39. bdz L(two)
  40. L(top):
  41. C r3 return value
  42. C r4 src, incrementing
  43. C r5 dst, incrementing
  44. C r6 lshift
  45. C r7 32-shift
  46. C r8 src[i+1] << shift
  47. C r9 src[i]
  48. C r10
  49. lwzu r10, -4(r4)
  50. srw r11, r9, r7
  51. or r8, r8, r11
  52. stwu r8, -4(r5)
  53. slw r8, r9, r6
  54. bdz L(odd)
  55. C r8 src[i+1] << shift
  56. C r9
  57. C r10 src[i]
  58. lwzu r9, -4(r4)
  59. srw r11, r10, r7
  60. or r8, r8, r11
  61. stwu r8, -4(r5)
  62. slw r8, r10, r6
  63. bdnz L(top)
  64. L(two):
  65. C r3 return value
  66. C r4
  67. C r5 &dst[2]
  68. C r6 shift
  69. C r7 32-shift
  70. C r8 src[1] << shift
  71. C r9 src[0]
  72. C r10
  73. srw r11, r9, r7
  74. slw r12, r9, r6 C src[0] << shift
  75. or r8, r8, r11
  76. stw r12, -8(r5) C dst[0]
  77. stw r8, -4(r5) C dst[1]
  78. blr
  79. L(odd):
  80. C r3 return value
  81. C r4
  82. C r5 &dst[2]
  83. C r6 shift
  84. C r7 32-shift
  85. C r8 src[1] << shift
  86. C r9
  87. C r10 src[0]
  88. srw r11, r10, r7
  89. slw r12, r10, r6
  90. or r8, r8, r11
  91. stw r12, -8(r5) C dst[0]
  92. stw r8, -4(r5) C dst[1]
  93. blr
  94. L(one):
  95. C r5 &dst[1]
  96. C r6 shift
  97. C r7 32-shift
  98. C r8 src[0]
  99. srw r3, r8, r7 C return value
  100. slw r8, r8, r6 C src[size-1] << shift
  101. stw r8, -4(r5) C dst[0]
  102. blr
  103. EPILOGUE(mpn_lshift)