정규식 사용팁

황제낙엽 2008.07.24 10:26 조회 수 : 699 추천:174

sitelink1  
sitelink2  
sitelink3  
sitelink4  
sitelink5  
sitelink6  

1. s 의 의미
대충 대충 정규식을 학습하면 쉽게 지나쳐버릴 부분인데, 나도 착각을 하고 있었다.
s는 단지 스페이스 한 문자만을 의미하는게 아니라 단어를 구분짓는 스페이스, 탭, 라인피드 등의 모든 공백 문자를 대표한다.
s -> [tnrf]
w -> [A-Z0-9]

고로 s 하나 사용하면 n, t 등은 더 적어넣을 필요 없다.

2. 검색 문자열 중간에 줄바꿈(n) 기호가 존재할 경우의 처리
사실 문제점이라기 보다는 정규식 처리에 있어서의 난해한 부분인데, 문자열 중간에 줄바꿈(n) 기호가 존재 할 경우 딱히 정해진 API라던가 이를 처리하기 위한 정해진 룰이 존재하지는 않는 것 같다.
예를 들면, <Script>int i = 0; n alert(i);</Script> 와 같은 코드에서  태그 사이의 문자열을 추출하고 싶을때 이것을 어떻게 추출할 것인가.
"([<]Script[>])(.|n)*([<]/Script[>])"로 해결해 보려 했지만 대실패였다. ㅜ_ㅜ 나중에 겨우 겨우 찾아냈는데
"([<]Script[>])([^<]*)([<]/Script[>])" <- 이렇게 하면 추출된다.

번호 제목 글쓴이 날짜 조회 수
» 사용팁 황제낙엽 2008.07.24 699
145 문자열 처리 - StringTokenizer 와 String.split() 황제낙엽 2008.07.08 663
144 숫자의 형식화 #1(Part-1)-java.text.NumberFormat 황제낙엽 2008.07.08 719
143 숫자 에 대응 되는 문자의 형식화 #2 황제낙엽 2008.07.08 711
142 숫자 에 대응 되는 패턴의 형식화 #1 황제낙엽 2008.07.08 731
141 숫자를 통화 표기 형태로 변환하기 황제낙엽 2008.07.08 699
140 NumberFormat, DecimalFormat 사용예 황제낙엽 2008.07.08 688
139 파일의 내용을 읽어 String 객체로 만드는 함수 황제낙엽 2008.06.17 545
138 UTF형태 파일에서 BOM 제거하기 황제낙엽 2008.06.16 2548
137 불러온 txt파일의 Encoding을 알 수는 방법좀 가르쳐 주세요~ 황제낙엽 2008.06.16 624
136 FileFilter, FilenameFilter 클래스를 이용한 파일 또는 디렉토리 리스트 추출하기 황제낙엽 2008.06.16 765
135 정규식 사용예제 [2] 황제낙엽 2008.06.11 678
134 정규식 사용예제 [1] 황제낙엽 2008.06.11 737
133 StringBuffer vs String 황제낙엽 2008.06.10 490
132 작지만 강력한 HTML 파서, HtmlCleaner, html parser 황제낙엽 2008.06.10 684
131 Jericho HTML Parser 황제낙엽 2008.06.10 824
130 JTidy(HTML Parser) How to 황제낙엽 2008.06.10 780
129 NekoHTML 샘플 예제 황제낙엽 2008.06.09 607
128 YGHTML Parser 0.1.1 샘플 예제 황제낙엽 2008.06.09 625
127 HTML Paser 의 종류 황제낙엽 2008.06.09 942