memset.S
上传用户:jlfgdled
上传日期:2013-04-10
资源大小:33168k
文件大小:1k
源码类别:

Linux/Unix编程

开发平台:

Unix_Linux

  1. /* Copyright 2002 Andi Kleen, SuSE Labs */
  2. /*
  3.  * ISO C memset - set a memory block to a byte value.
  4.  *
  5.  * rdi   destination
  6.  * rsi   value (char) 
  7.  * rdx   count (bytes) 
  8.  * 
  9.  * rax   original destination
  10.  */
  11.   .globl __memset
  12. .globl memset
  13. .p2align
  14. memset:
  15. __memset:
  16. movq %rdi,%r10
  17. movq %rdx,%r11
  18. /* expand byte value  */
  19. movzbl %sil,%ecx
  20. movabs $0x0101010101010101,%rax
  21. mul    %rcx /* with rax, clobbers rdx */
  22. /* align dst */
  23. movl  %edi,%r9d
  24. andl  $7,%r9d
  25. jnz  bad_alignment
  26. after_bad_alignment:
  27. movq %r11,%rcx
  28. movl $64,%r8d
  29. shrq $6,%rcx
  30. jz  handle_tail
  31. loop_64:
  32. movq  %rax,(%rdi) 
  33. movq  %rax,8(%rdi) 
  34. movq  %rax,16(%rdi) 
  35. movq  %rax,24(%rdi) 
  36. movq  %rax,32(%rdi) 
  37. movq  %rax,40(%rdi) 
  38. movq  %rax,48(%rdi) 
  39. movq  %rax,56(%rdi) 
  40. addq    %r8,%rdi
  41. decl   %ecx
  42. jnz    loop_64
  43. /* Handle tail in loops. The loops should be faster than hard
  44.    to predict jump tables. */ 
  45. handle_tail:
  46. movl %r11d,%ecx
  47. andl    $63&(~7),%ecx
  48. jz  handle_7
  49. shrl $3,%ecx
  50. loop_8:
  51. movq  %rax,(%rdi) 
  52. addq    $8,%rdi
  53. decl   %ecx
  54. jnz    loop_8
  55. handle_7:
  56. movl %r11d,%ecx
  57. andl $7,%ecx
  58. jz      ende
  59. loop_1:
  60. movb  %al,(%rdi)
  61. addq $1,%rdi
  62. decl    %ecx
  63. jnz     loop_1
  64. ende:
  65. movq %r10,%rax
  66. ret
  67. bad_alignment:
  68. cmpq $7,%r11
  69. jbe handle_7
  70. movq %rax,(%rdi) /* unaligned store */
  71. movq $8,%r8
  72. subq %r9,%r8 
  73. addq %r8,%rdi
  74. subq %r8,%r11
  75. jmp after_bad_alignment