encoding.n
上传用户:rrhhcc
上传日期:2015-12-11
资源大小:54129k
文件大小:3k
源码类别:

通讯编程

开发平台:

Visual C++

  1. '"
  2. '" Copyright (c) 1998 by Scriptics Corporation.
  3. '" 
  4. '" See the file "license.terms" for information on usage and redistribution
  5. '" of this file, and for a DISCLAIMER OF ALL WARRANTIES.
  6. '" 
  7. '" RCS: @(#) $Id: encoding.n,v 1.3.18.3 2004/10/27 14:23:56 dkf Exp $
  8. '" 
  9. .so man.macros
  10. .TH encoding n "8.1" Tcl "Tcl Built-In Commands"
  11. .BS
  12. .SH NAME
  13. encoding - Manipulate encodings
  14. .SH SYNOPSIS
  15. fBencoding fIoptionfR ?fIarg arg ...fR?
  16. .BE
  17. .SH INTRODUCTION
  18. .PP
  19. Strings in Tcl are encoded using 16-bit Unicode characters.  Different
  20. operating system interfaces or applications may generate strings in
  21. other encodings such as Shift-JIS.  The fBencodingfR command helps
  22. to bridge the gap between Unicode and these other formats.
  23. .SH DESCRIPTION
  24. .PP
  25. Performs one of several encoding related operations, depending on
  26. fIoptionfR.  The legal fIoptionfRs are:
  27. .TP
  28. fBencoding convertfromfR ?fIencodingfR? fIdatafR
  29. Convert fIdatafR to Unicode from the specified fIencodingfR.  The
  30. characters in fIdatafR are treated as binary data where the lower
  31. 8-bits of each character is taken as a single byte.  The resulting
  32. sequence of bytes is treated as a string in the specified
  33. fIencodingfR.  If fIencodingfR is not specified, the current
  34. system encoding is used.
  35. .TP
  36. fBencoding converttofR ?fIencodingfR? fIstringfR
  37. Convert fIstringfR from Unicode to the specified fIencodingfR.
  38. The result is a sequence of bytes that represents the converted
  39. string.  Each byte is stored in the lower 8-bits of a Unicode
  40. character.  If fIencodingfR is not specified, the current
  41. system encoding is used.
  42. .TP
  43. fBencoding namesfR
  44. Returns a list containing the names of all of the encodings that are
  45. currently available. 
  46. .TP
  47. fBencoding systemfR ?fIencodingfR?
  48. Set the system encoding to fIencodingfR. If fIencodingfR is
  49. omitted then the command returns the current system encoding.  The
  50. system encoding is used whenever Tcl passes strings to system calls.
  51. .SH EXAMPLE
  52. .PP
  53. It is common practice to write script files using a text editor that
  54. produces output in the euc-jp encoding, which represents the ASCII
  55. characters as singe bytes and Japanese characters as two bytes.  This
  56. makes it easy to embed literal strings that correspond to non-ASCII
  57. characters by simply typing the strings in place in the script.
  58. However, because the fBsourcefR command always reads files using the
  59. current system encoding, Tcl will only source such files correctly
  60. when the encoding used to write the file is the same.  This tends not
  61. to be true in an internationalized setting.  For example, if such a
  62. file was sourced in North America (where the ISO8859-1 is normally
  63. used), each byte in the file would be treated as a separate character
  64. that maps to the 00 page in Unicode.  The resulting Tcl strings will
  65. not contain the expected Japanese characters.  Instead, they will
  66. contain a sequence of Latin-1 characters that correspond to the bytes
  67. of the original string.  The fBencodingfR command can be used to
  68. convert this string to the expected Japanese Unicode characters.  For
  69. example,
  70. .CS
  71. set s [fBencoding convertfromfR euc-jp "\xA4\xCF"]
  72. .CE
  73. would return the Unicode string "\u306F", which is the Hiragana
  74. letter HA.
  75. .SH "SEE ALSO"
  76. Tcl_GetEncoding(3)
  77. .SH KEYWORDS
  78. encoding