sitelink1 https://ko.wikipedia.org/wiki/UTF-16 
sitelink2  
sitelink3  
sitelink4  
sitelink5  
extra_vars6  

UTF-16 - 위키백과, 우리 모두의 백과사전

UTF-16(16-bit Unicode Transformation Format)은 유니코드 문자 인코딩 방식의 하나이다. 주로 사용되는 기본 다국어 평면 (BMP, Basic multilingual plane)에 속하는 문자들은 그대로 16비트 값으로 인코딩이 되고 그 이상의 문자는 특별히 정해진 방식으로 32비트로 인코딩이 된다.

UTF-16은 유니코드 컨소시엄과 ISO/IEC 10646에 의해 정의되어 있다. 유니코드는 거기에 추가적인 내용을 정하고 있다. 정확한 차이점은 유니코드 4.0 표준의 부록편 C 부분이 자세히 기술되어 있다. ISO 표준은 UCS-2 인코딩도 정의하며 여기선 BMP의 16비트 표현만을 다룬다.

기본 다국어 평면은 U+0000 에서 U+FFFF 에 놓인 문자를 담고 있다. 이 영역에는 우리가 쉽게 생각할 수 있는 문자들이 포함되며, 한글, 한자 등은 모두 여기에 포함되어 있다. 이 영역에는 서러게이트 문자(surrogate)들이 준비되어 있어 16비트 이상의 문자를 표현할 때를 대비해 놓았다.

기본 다국어 평면의 문자들은 곧바로 16비트 값으로 대응되어 인코딩되며, 이 경우에는 인코딩된 바이트 스트링의 엔디언만 조심하면 된다.

번호 제목 글쓴이 날짜 조회 수
공지 Software Development Trend (with Java) 황제낙엽 2024.01.19 592
60 REST API 제대로 알고 사용하기 황제낙엽 2021.06.02 130
59 locale (로캘, 로케일) 황제낙엽 2021.03.19 112
58 [REST API] HTTP METHOD 종류 황제낙엽 2021.01.14 174
57 [Deno] TypeScript를 실행하기 위한 Command-line 런타임 황제낙엽 2021.01.14 100
56 어린이, 청소년용 프로그램 입문 황제낙엽 2017.05.03 166
55 컴퓨터는 음수를 2의 보수법으로 표현한다 file 황제낙엽 2016.10.24 843
54 변수를 unsigned int형 선언 0xffffffff 할당 결과가 -1이 되는 이유는? 황제낙엽 2016.10.24 486
53 0xFFFFFFFF의 값은 왜 -1인가? 황제낙엽 2016.10.24 326
52 unsigned와 signed 황제낙엽 2016.10.24 176
51 컴퓨터와 인간의 대화[20]-전각 문자와 반각 문자 황제낙엽 2016.04.22 233
50 컴퓨터와 인간의 대화[19]-인텔 HEX 황제낙엽 2016.04.22 123
49 컴퓨터와 인간의 대화[18]-베이스64 황제낙엽 2016.04.22 134
48 컴퓨터와 인간의 대화[17]-Surrogate Pair, Supplementary Characters file 황제낙엽 2016.04.22 127
» 컴퓨터와 인간의 대화[16]-UTF-16 황제낙엽 2016.04.22 118
46 컴퓨터와 인간의 대화[15]-UTF-8 황제낙엽 2016.04.22 131
45 컴퓨터와 인간의 대화[14]-euc(Extended UNIX Code) 황제낙엽 2016.04.22 122
44 컴퓨터와 인간의 대화[13]-char set 황제낙엽 2016.04.22 127
43 컴퓨터와 인간의 대화[12]-character encoding 황제낙엽 2016.04.22 87
42 컴퓨터와 인간의 대화[11]-byte 2 황제낙엽 2016.04.22 143
41 컴퓨터와 인간의 대화[10]-byte 1 황제낙엽 2016.04.22 189