자바I/O UTF형태 파일에서 BOM 제거하기

황제낙엽 2008.06.16 15:52 조회 수 : 2525 추천:254

sitelink1  
sitelink2  
sitelink3  
sitelink4  
sitelink5  
sitelink6  
/**
 * 입력받은 스트링에서 BOM을 제거한다
 * @param str
 * @return
 */
public static String removeUTF8BOM(String str) {
        // FEFF because this is the Unicode char represented by the UTF-8 byte order mark (EF BB BF).
        if (str.startsWith("uFEFF")) {
        str = str.substring(1);
        }
        return str;
}
 
 

참고사항 : BOM은 다음과 같은 형태가 존재한다. (모든 UTF형태의 문서에서 BOM검사를 수행하려면 다음을 참고한다.)

00 00 FE FF         UTF-32, big-endian
FF FE 00 00         UTF-32, little-endian
FE FF                 UTF-16, big-endian
FF FE                 UTF-16, little-endian
EF BB BF            UTF-8
번호 제목 글쓴이 날짜 조회 수
143 숫자 에 대응 되는 패턴의 형식화 #1 황제낙엽 2008.07.08 718
142 숫자를 통화 표기 형태로 변환하기 황제낙엽 2008.07.08 683
141 NumberFormat, DecimalFormat 사용예 황제낙엽 2008.07.08 674
140 파일의 내용을 읽어 String 객체로 만드는 함수 황제낙엽 2008.06.17 526
» UTF형태 파일에서 BOM 제거하기 황제낙엽 2008.06.16 2525
138 불러온 txt파일의 Encoding을 알 수는 방법좀 가르쳐 주세요~ 황제낙엽 2008.06.16 622
137 FileFilter, FilenameFilter 클래스를 이용한 파일 또는 디렉토리 리스트 추출하기 황제낙엽 2008.06.16 760
136 정규식 사용예제 [2] 황제낙엽 2008.06.11 673
135 정규식 사용예제 [1] 황제낙엽 2008.06.11 720
134 StringBuffer vs String 황제낙엽 2008.06.10 475
133 작지만 강력한 HTML 파서, HtmlCleaner, html parser 황제낙엽 2008.06.10 675
132 Jericho HTML Parser 황제낙엽 2008.06.10 819
131 JTidy(HTML Parser) How to 황제낙엽 2008.06.10 754
130 NekoHTML 샘플 예제 황제낙엽 2008.06.09 595
129 YGHTML Parser 0.1.1 샘플 예제 황제낙엽 2008.06.09 620
128 HTML Paser 의 종류 황제낙엽 2008.06.09 917
127 File 생성시 encoding 지정하기 (Unicode/utf-8 file 읽고 쓰기) 황제낙엽 2008.05.22 998
126 java String.replaceAll (String regex, String replacement) 쓸떄 조심할 것 황제낙엽 2008.05.22 711
125 java String.replaceAll 잘쓰기 황제낙엽 2008.05.22 744
124 간단한 DBConnection 프로그램 (JDBC) file 황제낙엽 2008.05.15 784