sitelink1  
sitelink2  
sitelink3  
sitelink4  
sitelink5  
sitelink6  
http://unicode.org/unicode/faq/utf_bom.htmlhttp://kin.naver.com/detail/detail.php?d1id=1&dir_id=10106&eid=NMKCLkuyB8Z47FHKs2nFBDuTwIThFIDa&qb=amF2YSB1dGYgYm9t&pid=faULRdoQsD4ssv1S3Ywsss--095327&sid=SFW2IEqfVUgAAA-P4fI
유니코드 파일에는 파일 첫부분에 몇바이트가 특정 값으로 설정됩니다.
아스키 파일은 그런 규칙이 정해진 게 없구요.
그 정해진 바이트 값을 BOM(Byte Order Mark)라고 합니다.
 
파일을 Binary 리더로 읽으셔서 첫 몇바이트를 우선 읽은 다음에,
유니코드 파일인지 확인하고 유니코드냐 아스키냐를 선택하시면 될 것 같네요.
 
바이트값 정해진 것은 http://unicode.org/unicode/faq/utf_bom.html 문서에 나옵니다.
(BOM 검색하시면 다른 자료들도 있을 듯...)
 
BytesEncoding Form
00 00 FE FFUTF-32, big-endian
FF FE 00 00UTF-32, little-endian
FE FFUTF-16, big-endian
FF FEUTF-16, little-endian
EF BB BFUTF-8

 
아스키 파일은 정해진 규칙이 없습니다.
유니코드 파일이 아니다- 라고 결정되면 아스키로 보시면 무방할 겁니다.


번호 제목 글쓴이 날짜 조회 수
146 사용팁 황제낙엽 2008.07.24 697
145 문자열 처리 - StringTokenizer 와 String.split() 황제낙엽 2008.07.08 657
144 숫자의 형식화 #1(Part-1)-java.text.NumberFormat 황제낙엽 2008.07.08 713
143 숫자 에 대응 되는 문자의 형식화 #2 황제낙엽 2008.07.08 704
142 숫자 에 대응 되는 패턴의 형식화 #1 황제낙엽 2008.07.08 724
141 숫자를 통화 표기 형태로 변환하기 황제낙엽 2008.07.08 693
140 NumberFormat, DecimalFormat 사용예 황제낙엽 2008.07.08 684
139 파일의 내용을 읽어 String 객체로 만드는 함수 황제낙엽 2008.06.17 531
138 UTF형태 파일에서 BOM 제거하기 황제낙엽 2008.06.16 2540
» 불러온 txt파일의 Encoding을 알 수는 방법좀 가르쳐 주세요~ 황제낙엽 2008.06.16 622
136 FileFilter, FilenameFilter 클래스를 이용한 파일 또는 디렉토리 리스트 추출하기 황제낙엽 2008.06.16 761
135 정규식 사용예제 [2] 황제낙엽 2008.06.11 673
134 정규식 사용예제 [1] 황제낙엽 2008.06.11 727
133 StringBuffer vs String 황제낙엽 2008.06.10 480
132 작지만 강력한 HTML 파서, HtmlCleaner, html parser 황제낙엽 2008.06.10 678
131 Jericho HTML Parser 황제낙엽 2008.06.10 820
130 JTidy(HTML Parser) How to 황제낙엽 2008.06.10 772
129 NekoHTML 샘플 예제 황제낙엽 2008.06.09 601
128 YGHTML Parser 0.1.1 샘플 예제 황제낙엽 2008.06.09 621
127 HTML Paser 의 종류 황제낙엽 2008.06.09 933