logops_n.asm
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:7k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. dnl  IA-64 mpn_and_n, mpn_andn_n, mpn_nand_n, mpn_ior_n, mpn_iorn_n,
  2. dnl  mpn_nior_n, mpn_xor_n, mpn_xnor_n -- mpn bitwise logical operations.
  3. dnl  Copyright 2003, 2004, 2005 Free Software Foundation, Inc.
  4. dnl
  5. dnl  This file is part of the GNU MP Library.
  6. dnl
  7. dnl  The GNU MP Library is free software; you can redistribute it and/or modify
  8. dnl  it under the terms of the GNU Lesser General Public License as published
  9. dnl  by the Free Software Foundation; either version 3 of the License, or (at
  10. dnl  your option) any later version.
  11. dnl
  12. dnl  The GNU MP Library is distributed in the hope that it will be useful, but
  13. dnl  WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  14. dnl  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  15. dnl  License for more details.
  16. dnl
  17. dnl  You should have received a copy of the GNU Lesser General Public License
  18. dnl  along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.
  19. include(`../config.m4')
  20. C           cycles/limb
  21. C Itanium:      2
  22. C Itanium 2:    1
  23. C TODO
  24. C  * Use rp,rpx scheme of aors_n.asm to allow parallel stores (useful in
  25. C    wind-down code).
  26. C INPUT PARAMETERS
  27. define(`rp', `r32')
  28. define(`up', `r33')
  29. define(`vp', `r34')
  30. define(`n', `r35')
  31. ifdef(`OPERATION_and_n',
  32. ` define(`func',`mpn_and_n')
  33. define(`logop', `and $1 = $2, $3')
  34. define(`notormov', `mov $1 = $2')')
  35. ifdef(`OPERATION_andn_n',
  36. ` define(`func',`mpn_andn_n')
  37. define(`logop', `andcm $1 = $2, $3')
  38. define(`notormov', `mov $1 = $2')')
  39. ifdef(`OPERATION_nand_n',
  40. ` define(`func',`mpn_nand_n')
  41. define(`logop', `and $1 = $2, $3')
  42. define(`notormov', `sub $1 = -1, $2')')
  43. ifdef(`OPERATION_ior_n',
  44. ` define(`func',`mpn_ior_n')
  45. define(`logop', `or $1 = $2, $3')
  46. define(`notormov', `mov $1 = $2')')
  47. ifdef(`OPERATION_iorn_n',
  48. ` define(`func',`mpn_iorn_n')
  49. define(`logop', `andcm $1 = $3, $2')
  50. define(`notormov', `sub $1 = -1, $2')')
  51. ifdef(`OPERATION_nior_n',
  52. ` define(`func',`mpn_nior_n')
  53. define(`logop', `or $1 = $2, $3')
  54. define(`notormov', `sub $1 = -1, $2')')
  55. ifdef(`OPERATION_xor_n',
  56. ` define(`func',`mpn_xor_n')
  57. define(`logop', `xor $1 = $2, $3')
  58. define(`notormov', `mov $1 = $2')')
  59. ifdef(`OPERATION_xnor_n',
  60. ` define(`func',`mpn_xnor_n')
  61. define(`logop', `xor $1 = $2, $3')
  62. define(`notormov', `sub $1 = -1, $2')')
  63. MULFUNC_PROLOGUE(mpn_and_n mpn_andn_n mpn_nand_n mpn_ior_n mpn_iorn_n mpn_nior_n mpn_xor_n mpn_xnor_n)
  64. ASM_START()
  65. PROLOGUE(func)
  66. .prologue
  67. .save ar.lc, r2
  68. .body
  69. ifdef(`HAVE_ABI_32',
  70. ` addp4 rp = 0, rp C M I
  71. addp4 up = 0, up C M I
  72. addp4 vp = 0, vp C M I
  73. zxt4 n = n C I
  74. ;;
  75. ')
  76. {.mmi
  77. ld8 r10 = [up], 8 C M
  78. ld8 r11 = [vp], 8 C M
  79. mov.i r2 = ar.lc C I0
  80. }
  81. {.mmi
  82. and r14 = 3, n C M I
  83. cmp.lt p15, p14 = 4, n C M I
  84. shr.u n = n, 2 C I0
  85. ;;
  86. }
  87. {.mmi
  88. cmp.eq p6, p0 = 1, r14 C M I
  89. cmp.eq p7, p0 = 2, r14 C M I
  90. cmp.eq p8, p0 = 3, r14 C M I
  91. }
  92. {.bbb
  93.    (p6) br.dptk .Lb01 C B
  94.    (p7) br.dptk .Lb10 C B
  95.    (p8) br.dptk .Lb11 C B
  96. }
  97. .Lb00: ld8 r17 = [up], 8 C M
  98. ld8 r21 = [vp], 8 C M
  99. add n = -2, n C M I
  100. ;;
  101. ld8 r18 = [up], 8 C M
  102. ld8 r22 = [vp], 8 C M
  103. ;;
  104. ld8 r19 = [up], 8 C M
  105. ld8 r23 = [vp], 8 C M
  106.   (p15) br.cond.dpnt .grt4 C B
  107. logop( r14, r10, r11) C M I
  108. ;;
  109. logop( r15, r17, r21) C M I
  110. notormov( r8, r14) C M I
  111. br .Lcj4 C B
  112. .grt4: logop( r14, r10, r11) C M I
  113. ld8 r16 = [up], 8 C M
  114. ld8 r20 = [vp], 8 C M
  115. ;;
  116. logop( r15, r17, r21) C M I
  117. ld8 r17 = [up], 8 C M
  118. mov.i ar.lc = n C I0
  119. notormov( r8, r14) C M I
  120. ld8 r21 = [vp], 8 C M
  121. br .LL00 C B
  122. .Lb01: add n = -1, n C M I
  123. logop( r15, r10, r11) C M I
  124.   (p15) br.cond.dpnt .grt1 C B
  125. ;;
  126. notormov( r9, r15) C M I
  127. br .Lcj1 C B
  128. .grt1: ld8 r16 = [up], 8 C M
  129. ld8 r20 = [vp], 8 C M
  130. ;;
  131. ld8 r17 = [up], 8 C M
  132. ld8 r21 = [vp], 8 C M
  133. mov.i ar.lc = n C I0
  134. ;;
  135. ld8 r18 = [up], 8 C M
  136. ld8 r22 = [vp], 8 C M
  137. ;;
  138. ld8 r19 = [up], 8 C M
  139. ld8 r23 = [vp], 8 C M
  140. br.cloop.dptk .grt5 C B
  141. ;;
  142. logop( r14, r16, r20) C M I
  143. notormov( r9, r15) C M I
  144. br .Lcj5 C B
  145. .grt5: logop( r14, r16, r20) C M I
  146. ld8 r16 = [up], 8 C M
  147. notormov( r9, r15) C M I
  148. ld8 r20 = [vp], 8 C M
  149. br .LL01 C B
  150. .Lb10: ld8 r19 = [up], 8 C M
  151. ld8 r23 = [vp], 8 C M
  152.   (p15) br.cond.dpnt .grt2 C B
  153. logop( r14, r10, r11) C M I
  154. ;;
  155. logop( r15, r19, r23) C M I
  156. notormov( r8, r14) C M I
  157. br .Lcj2 C B
  158. .grt2: ld8 r16 = [up], 8 C M
  159. ld8 r20 = [vp], 8 C M
  160. add n = -1, n C M I
  161. ;;
  162. ld8 r17 = [up], 8 C M
  163. ld8 r21 = [vp], 8 C M
  164. logop( r14, r10, r11) C M I
  165. ;;
  166. ld8 r18 = [up], 8 C M
  167. ld8 r22 = [vp], 8 C M
  168. mov.i ar.lc = n C I0
  169. ;;
  170. logop( r15, r19, r23) C M I
  171. ld8 r19 = [up], 8 C M
  172. notormov( r8, r14) C M I
  173. ld8 r23 = [vp], 8 C M
  174. br.cloop.dptk .Loop C B
  175. br .Lcj6 C B
  176. .Lb11: ld8 r18 = [up], 8 C M
  177. ld8 r22 = [vp], 8 C M
  178. add n = -1, n C M I
  179. ;;
  180. ld8 r19 = [up], 8 C M
  181. ld8 r23 = [vp], 8 C M
  182. logop( r15, r10, r11) C M I
  183.   (p15) br.cond.dpnt .grt3 C B
  184. ;;
  185. logop( r14, r18, r22) C M I
  186. notormov( r9, r15) C M I
  187. br .Lcj3 C B
  188. .grt3: ld8 r16 = [up], 8 C M
  189. ld8 r20 = [vp], 8 C M
  190. ;;
  191. ld8 r17 = [up], 8 C M
  192. ld8 r21 = [vp], 8 C M
  193. mov.i ar.lc = n C I0
  194. ;;
  195. logop( r14, r18, r22) C M I
  196. ld8 r18 = [up], 8 C M
  197. notormov( r9, r15) C M I
  198. ld8 r22 = [vp], 8 C M
  199. br .LL11 C B
  200. C *** MAIN LOOP START ***
  201. ALIGN(32)
  202. .Loop: st8 [rp] = r8, 8 C M
  203. logop( r14, r16, r20) C M I
  204. notormov( r9, r15) C M I
  205. ld8 r16 = [up], 8 C M
  206. ld8 r20 = [vp], 8 C M
  207. nop.b 0
  208. ;;
  209. .LL01: st8 [rp] = r9, 8 C M
  210. logop( r15, r17, r21) C M I
  211. notormov( r8, r14) C M I
  212. ld8 r17 = [up], 8 C M
  213. ld8 r21 = [vp], 8 C M
  214. nop.b 0
  215. ;;
  216. .LL00: st8 [rp] = r8, 8 C M
  217. logop( r14, r18, r22) C M I
  218. notormov( r9, r15) C M I
  219. ld8 r18 = [up], 8 C M
  220. ld8 r22 = [vp], 8 C M
  221. nop.b 0
  222. ;;
  223. .LL11: st8 [rp] = r9, 8 C M
  224. logop( r15, r19, r23) C M I
  225. notormov( r8, r14) C M I
  226. ld8 r19 = [up], 8 C M
  227. ld8 r23 = [vp], 8 C M
  228. br.cloop.dptk .Loop ;; C B
  229. C *** MAIN LOOP END ***
  230. .Lcj6: st8 [rp] = r8, 8 C M
  231. logop( r14, r16, r20) C M I
  232. notormov( r9, r15) C M I
  233. ;;
  234. .Lcj5: st8 [rp] = r9, 8 C M
  235. logop( r15, r17, r21) C M I
  236. notormov( r8, r14) C M I
  237. ;;
  238. .Lcj4: st8 [rp] = r8, 8 C M
  239. logop( r14, r18, r22) C M I
  240. notormov( r9, r15) C M I
  241. ;;
  242. .Lcj3: st8 [rp] = r9, 8 C M
  243. logop( r15, r19, r23) C M I
  244. notormov( r8, r14) C M I
  245. ;;
  246. .Lcj2: st8 [rp] = r8, 8 C M
  247. notormov( r9, r15) C M I
  248. ;;
  249. .Lcj1: st8 [rp] = r9, 8 C M
  250. mov.i ar.lc = r2 C I0
  251. br.ret.sptk.many b0 C B
  252. EPILOGUE()
  253. ASM_END()