sitelink1 https://ko.wikipedia.org/wiki/UTF-16 
sitelink2  
sitelink3  
sitelink4  
sitelink5  
extra_vars6  

UTF-16 - 위키백과, 우리 모두의 백과사전

UTF-16(16-bit Unicode Transformation Format)은 유니코드 문자 인코딩 방식의 하나이다. 주로 사용되는 기본 다국어 평면 (BMP, Basic multilingual plane)에 속하는 문자들은 그대로 16비트 값으로 인코딩이 되고 그 이상의 문자는 특별히 정해진 방식으로 32비트로 인코딩이 된다.

UTF-16은 유니코드 컨소시엄과 ISO/IEC 10646에 의해 정의되어 있다. 유니코드는 거기에 추가적인 내용을 정하고 있다. 정확한 차이점은 유니코드 4.0 표준의 부록편 C 부분이 자세히 기술되어 있다. ISO 표준은 UCS-2 인코딩도 정의하며 여기선 BMP의 16비트 표현만을 다룬다.

기본 다국어 평면은 U+0000 에서 U+FFFF 에 놓인 문자를 담고 있다. 이 영역에는 우리가 쉽게 생각할 수 있는 문자들이 포함되며, 한글, 한자 등은 모두 여기에 포함되어 있다. 이 영역에는 서러게이트 문자(surrogate)들이 준비되어 있어 16비트 이상의 문자를 표현할 때를 대비해 놓았다.

기본 다국어 평면의 문자들은 곧바로 16비트 값으로 대응되어 인코딩되며, 이 경우에는 인코딩된 바이트 스트링의 엔디언만 조심하면 된다.

번호 제목 글쓴이 날짜 조회 수
공지 Software Development Trend (with Java) 황제낙엽 2024.01.19 609
60 REST API 제대로 알고 사용하기 황제낙엽 2021.06.02 134
59 locale (로캘, 로케일) 황제낙엽 2021.03.19 117
58 [REST API] HTTP METHOD 종류 황제낙엽 2021.01.14 182
57 [Deno] TypeScript를 실행하기 위한 Command-line 런타임 황제낙엽 2021.01.14 103
56 어린이, 청소년용 프로그램 입문 황제낙엽 2017.05.03 167
55 컴퓨터는 음수를 2의 보수법으로 표현한다 file 황제낙엽 2016.10.24 845
54 변수를 unsigned int형 선언 0xffffffff 할당 결과가 -1이 되는 이유는? 황제낙엽 2016.10.24 492
53 0xFFFFFFFF의 값은 왜 -1인가? 황제낙엽 2016.10.24 337
52 unsigned와 signed 황제낙엽 2016.10.24 178
51 컴퓨터와 인간의 대화[20]-전각 문자와 반각 문자 황제낙엽 2016.04.22 236
50 컴퓨터와 인간의 대화[19]-인텔 HEX 황제낙엽 2016.04.22 125
49 컴퓨터와 인간의 대화[18]-베이스64 황제낙엽 2016.04.22 137
48 컴퓨터와 인간의 대화[17]-Surrogate Pair, Supplementary Characters file 황제낙엽 2016.04.22 128
» 컴퓨터와 인간의 대화[16]-UTF-16 황제낙엽 2016.04.22 120
46 컴퓨터와 인간의 대화[15]-UTF-8 황제낙엽 2016.04.22 136
45 컴퓨터와 인간의 대화[14]-euc(Extended UNIX Code) 황제낙엽 2016.04.22 124
44 컴퓨터와 인간의 대화[13]-char set 황제낙엽 2016.04.22 127
43 컴퓨터와 인간의 대화[12]-character encoding 황제낙엽 2016.04.22 88
42 컴퓨터와 인간의 대화[11]-byte 2 황제낙엽 2016.04.22 146
41 컴퓨터와 인간의 대화[10]-byte 1 황제낙엽 2016.04.22 203