VISmemset.S
上传用户:jlfgdled
上传日期:2013-04-10
资源大小:33168k
文件大小:5k
源码类别:

Linux/Unix编程

开发平台:

Unix_Linux

  1. /* $Id: VISmemset.S,v 1.10 1999/12/23 17:02:16 jj Exp $
  2.  * VISmemset.S: High speed memset operations utilizing the UltraSparc
  3.  *        Visual Instruction Set.
  4.  *
  5.  * Copyright (C) 1997 David S. Miller (davem@caip.rutgers.edu)
  6.  * Copyright (C) 1996, 1997, 1999 Jakub Jelinek (jakub@redhat.com)
  7.  */
  8. #include "VIS.h"
  9. #ifdef REGS_64BIT
  10. #define SET_BLOCKS(base, offset, source)
  11. stx source, [base - offset - 0x18];
  12. stx source, [base - offset - 0x10];
  13. stx source, [base - offset - 0x08];
  14. stx source, [base - offset - 0x00];
  15. #else
  16. #define SET_BLOCKS(base, offset, source)
  17. stw source, [base - offset - 0x18];
  18. stw source, [base - offset - 0x14];
  19. stw source, [base - offset - 0x10];
  20. stw source, [base - offset - 0x0c];
  21. stw source, [base - offset - 0x08];
  22. stw source, [base - offset - 0x04];
  23. stw source, [base - offset - 0x00];
  24. stw source, [base - offset + 0x04];
  25. #endif
  26. #ifndef __KERNEL__
  27. /* So that the brz,a,pt in memset doesn't have to get through PLT, here we go... */
  28. #include "VISbzero.S"
  29. #endif
  30. #ifdef __KERNEL__
  31. #include <asm/visasm.h>
  32. #endif
  33. /* Well, memset is a lot easier to get right than bcopy... */
  34. .text
  35. .align 32
  36. #ifdef __KERNEL__
  37. .globl __memset
  38. __memset:
  39. #endif
  40. .globl memset
  41. memset:
  42. #ifndef __KERNEL__
  43. brz,a,pt %o1, bzero_private
  44.  mov %o2, %o1
  45. #ifndef REGS_64BIT
  46. srl %o2, 0, %o2
  47. #endif
  48. #endif
  49. mov %o0, %o4
  50. cmp %o2, 7
  51. bleu,pn %xcc, 17f
  52.  andcc %o0, 3, %g5
  53. be,pt %xcc, 4f
  54.  and %o1, 0xff, %o1
  55. cmp %g5, 3
  56. be,pn %xcc, 2f
  57.  stb %o1, [%o0 + 0x00]
  58. cmp %g5, 2
  59. be,pt %xcc, 2f
  60.  stb %o1, [%o0 + 0x01]
  61. stb %o1, [%o0 + 0x02]
  62. 2: sub %g5, 4, %g5
  63. sub %o0, %g5, %o0
  64. add %o2, %g5, %o2
  65. 4: sllx %o1, 8, %g1
  66. andcc %o0, 4, %g0
  67. or %o1, %g1, %o1
  68. sllx %o1, 16, %g1
  69. or %o1, %g1, %o1
  70. be,pt %xcc, 2f
  71. #ifdef REGS_64BIT
  72.  sllx %o1, 32, %g1
  73. #else
  74.  cmp %o2, 128
  75. #endif
  76. stw %o1, [%o0]
  77. sub %o2, 4, %o2
  78. add %o0, 4, %o0
  79. 2:
  80. #ifdef REGS_64BIT
  81. cmp %o2, 128
  82. or %o1, %g1, %o1
  83. #endif
  84. blu,pn %xcc, 9f
  85.  andcc %o0, 0x38, %g5
  86. be,pn %icc, 6f
  87.  mov 64, %o5
  88. andcc %o0, 8, %g0
  89. be,pn %icc, 1f
  90.  sub %o5, %g5, %o5
  91. #ifdef REGS_64BIT
  92. stx %o1, [%o0]
  93. #else
  94. stw %o1, [%o0]
  95. stw %o1, [%o0 + 4]
  96. #endif
  97. add %o0, 8, %o0
  98. 1: andcc %o5, 16, %g0
  99. be,pn %icc, 1f
  100.  sub %o2, %o5, %o2
  101. #ifdef REGS_64BIT
  102. stx %o1, [%o0]
  103. stx %o1, [%o0 + 8]
  104. #else
  105. stw %o1, [%o0]
  106. stw %o1, [%o0 + 4]
  107. stw %o1, [%o0 + 8]
  108. stw %o1, [%o0 + 12]
  109. #endif
  110. add %o0, 16, %o0
  111. 1: andcc %o5, 32, %g0
  112. be,pn %icc, 7f
  113.  andncc %o2, 0x3f, %o3
  114. #ifdef REGS_64BIT
  115. stx %o1, [%o0]
  116. stx %o1, [%o0 + 8]
  117. stx %o1, [%o0 + 16]
  118. stx %o1, [%o0 + 24]
  119. #else
  120. stw %o1, [%o0]
  121. stw %o1, [%o0 + 4]
  122. stw %o1, [%o0 + 8]
  123. stw %o1, [%o0 + 12]
  124. stw %o1, [%o0 + 16]
  125. stw %o1, [%o0 + 20]
  126. stw %o1, [%o0 + 24]
  127. stw %o1, [%o0 + 28]
  128. #endif
  129. add %o0, 32, %o0
  130. 7: be,pn %xcc, 9f
  131.  nop
  132. #ifdef __KERNEL__
  133. VISEntryHalf
  134. #endif
  135. ldd [%o0 - 8], %f0
  136. 18: rd %asi, %g2
  137. wr %g0, ASI_BLK_P, %asi
  138. membar #StoreStore | #LoadStore
  139. andcc %o3, 0xc0, %g5
  140. and %o2, 0x3f, %o2
  141. fmovd %f0, %f2
  142. fmovd %f0, %f4
  143. andn %o3, 0xff, %o3
  144. fmovd %f0, %f6
  145. cmp %g5, 64
  146. fmovd %f0, %f8
  147. fmovd %f0, %f10
  148. fmovd %f0, %f12
  149. brz,pn %g5, 10f
  150.  fmovd %f0, %f14
  151. be,pn %icc, 2f
  152.  stda %f0, [%o0 + 0x00] %asi
  153. cmp %g5, 128
  154. be,pn %icc, 2f
  155.  stda %f0, [%o0 + 0x40] %asi
  156. stda %f0, [%o0 + 0x80] %asi
  157. 2: brz,pn %o3, 12f
  158.  add %o0, %g5, %o0
  159. 10: stda %f0, [%o0 + 0x00] %asi
  160. stda %f0, [%o0 + 0x40] %asi
  161. stda %f0, [%o0 + 0x80] %asi
  162. stda %f0, [%o0 + 0xc0] %asi
  163. 11: subcc %o3, 256, %o3
  164. bne,pt %xcc, 10b
  165.  add %o0, 256, %o0
  166. 12:
  167. #ifdef __KERNEL__
  168. wr %g2, %g0, %asi
  169. VISExitHalf
  170. #else
  171. #ifndef REGS_64BIT
  172. wr %g0, FPRS_FEF, %fprs
  173. #endif
  174. #endif
  175. membar #StoreLoad | #StoreStore
  176. 9: andcc %o2, 0x78, %g5
  177. be,pn %xcc, 13f
  178.  andcc %o2, 7, %o2
  179. #ifdef __KERNEL__
  180. 14: srl %g5, 1, %o3
  181. sethi %hi(13f), %g3
  182. sub %g3, %o3, %g3
  183. jmpl %g3 + %lo(13f), %g0
  184.  add %o0, %g5, %o0
  185. #else
  186. 14: rd %pc, %g3
  187. #ifdef REGS_64BIT
  188. srl %g5, 1, %o3
  189. sub %g3, %o3, %g3
  190. #else
  191. sub %g3, %g5, %g3
  192. #endif
  193. jmpl %g3 + (13f - 14b), %g0
  194.  add %o0, %g5, %o0
  195. #endif
  196. 12: SET_BLOCKS(%o0, 0x68, %o1)
  197. SET_BLOCKS(%o0, 0x48, %o1)
  198. SET_BLOCKS(%o0, 0x28, %o1)
  199. SET_BLOCKS(%o0, 0x08, %o1)
  200. 13: be,pn %xcc, 8f
  201.  andcc %o2, 4, %g0
  202. be,pn %xcc, 1f
  203.  andcc %o2, 2, %g0
  204. stw %o1, [%o0]
  205. add %o0, 4, %o0
  206. 1: be,pn %xcc, 1f
  207.  andcc %o2, 1, %g0
  208. sth %o1, [%o0]
  209. add %o0, 2, %o0
  210. 1: bne,a,pn %xcc, 8f
  211.  stb %o1, [%o0]
  212. 8: retl
  213.  mov %o4, %o0
  214. 17: brz,pn %o2, 0f
  215. 8:  add %o0, 1, %o0
  216. subcc %o2, 1, %o2
  217. bne,pt %xcc, 8b
  218.  stb %o1, [%o0 - 1]
  219. 0: retl
  220.  mov %o4, %o0
  221. 6:
  222. #ifdef REGS_64BIT
  223. stx %o1, [%o0]
  224. #else
  225. stw %o1, [%o0]
  226. stw %o1, [%o0 + 4]
  227. #endif
  228. andncc %o2, 0x3f, %o3
  229. be,pn %xcc, 9b
  230.  nop
  231. #ifdef __KERNEL__
  232. VISEntryHalf
  233. #endif
  234. ba,pt %xcc, 18b
  235.  ldd [%o0], %f0