bdiv_dbm1c.asm
上传用户:qaz666999
上传日期:2022-08-06
资源大小:2570k
文件大小:2k
源码类别:

数学计算

开发平台:

Unix_Linux

  1. dnl  x86_64 mpn_bdiv_dbm1.
  2. dnl  Copyright 2008 Free Software Foundation, Inc.
  3. dnl  This file is part of the GNU MP Library.
  4. dnl  The GNU MP Library is free software; you can redistribute it and/or modify
  5. dnl  it under the terms of the GNU Lesser General Public License as published
  6. dnl  by the Free Software Foundation; either version 3 of the License, or (at
  7. dnl  your option) any later version.
  8. dnl  The GNU MP Library is distributed in the hope that it will be useful, but
  9. dnl  WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY
  10. dnl  or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU Lesser General Public
  11. dnl  License for more details.
  12. dnl  You should have received a copy of the GNU Lesser General Public License
  13. dnl  along with the GNU MP Library.  If not, see http://www.gnu.org/licenses/.
  14. include(`../config.m4')
  15. C      cycles/limb
  16. C K8,K9:  2.25
  17. C K10:   ?
  18. C P4: 12.5
  19. C P6 core2:   4.0
  20. C P6 corei7:   3.8
  21. C P6 atom: 20
  22. C TODO
  23. C  * Do proper 4-way feed-in instead of the current epilogue
  24. C INPUT PARAMETERS shared
  25. define(`qp', `%rdi')
  26. define(`up', `%rsi')
  27. define(`n', `%rdx')
  28. define(`bd', `%rcx')
  29. define(`cy', `%r8')
  30. ASM_START()
  31. TEXT
  32. ALIGN(16)
  33. PROLOGUE(mpn_bdiv_dbm1c)
  34. mov (%rsi), %rax
  35. mov %rdx, %r9 C n
  36. mul %rcx
  37. sub %rax, %r8
  38. mov %r8, (%rdi)
  39. sbb %rdx, %r8
  40. lea (%rsi,%r9,8), %rsi
  41. lea (%rdi,%r9,8), %rdi
  42. neg %r9
  43. add $4, %r9
  44. jns L(end)
  45. ALIGN(16)
  46. L(top):
  47. mov -24(%rsi,%r9,8), %rax
  48. mul %rcx
  49. sub %rax, %r8
  50. mov %r8, -24(%rdi,%r9,8)
  51. sbb %rdx, %r8
  52. L(3):
  53. mov -16(%rsi,%r9,8), %rax
  54. mul %rcx
  55. sub %rax, %r8
  56. mov %r8, -16(%rdi,%r9,8)
  57. sbb %rdx, %r8
  58. L(2):
  59. mov -8(%rsi,%r9,8), %rax
  60. mul %rcx
  61. sub %rax, %r8
  62. mov %r8, -8(%rdi,%r9,8)
  63. sbb %rdx, %r8
  64. L(1):
  65. mov (%rsi,%r9,8), %rax
  66. mul %rcx
  67. sub %rax, %r8
  68. mov %r8, (%rdi,%r9,8)
  69. sbb %rdx, %r8
  70. add $4, %r9
  71. js L(top)
  72. L(end):
  73. je L(3x)
  74. cmp $2, %r9
  75. jg L(ret)
  76. mov $-1, %r9
  77. je L(1)
  78. jmp L(2)
  79. L(3x):
  80. dec %r9
  81. jmp L(3)
  82. L(ret): mov %r8, %rax
  83. ret
  84. EPILOGUE()