\w 및 \b에 대한 Java 정규식의 유니코드 지원을 어떻게 향상시킬 수 있습니까?
Java 정규 표현식의 w 및 b에 해당하는 유니코드
Java의 정규식 구현은 유니코드에 대한 지원이 제한되어 있으므로 단어 또는 일치 항목을 일치시키기가 어렵습니다. 단어 경계를 정확하게 지정합니다. 기본 w 및 b 이스케이프는 ASCII 문자에만 해당합니다.
이 문제를 해결하려면 이러한 이스케이프를 다시 작성하고 유니코드 인식 정의로 바꾸는 함수를 사용하는 것이 좋습니다. 이 함수는 다음 14개의 문자 클래스 이스케이프를 다시 작성할 수 있습니다.
\w \W \s \S \v \V \h \H \d \D \b \B \X \R
다시 작성된 이스케이프 정의:
- w: 문자, 숫자 및 특정 구두점 문자를 캡처합니다. (p{L}pMp{Nd}p{Nl}p{Pc}[p{InEnclosedAlphanumerics}&&p;p{So}]])
- W: w와 일치하는 모든 문자를 제외합니다
- s: 유니코드 공백과 일치 ([u0009-u000Du0020u0085u00A0u1680u180Eu2000-u200Au2028u2029u202Fu205Fu3000])
- S: s
- 와 일치하는 모든 문자 제외 v: 유니코드 수직과 일치 공백 ([u000A-u000Du0085u2028u2029])
- V: v와 일치하는 모든 문자를 제외
- h: 유니코드 가로 공백과 일치 ([u0009u0020u00A0u1680u180Eu2000-u200Au202Fu205Fu3000])
- H: h와 일치하는 모든 문자 제외
- d: 유니코드 숫자와 일치 (p{Nd})
- D: d와 일치하는 모든 문자 제외
- b: 유니코드 단어 문자만 고려하여 단어 경계와 일치
- B: 단어 이외의 경계와 일치 유니코드 단어 문자
- X: 확장 문자소 클러스터와 일치
- R: 줄과 일치 유니코드 줄 바꿈을 포함한 나누기
경계 정의:
경계 이스케이프(b 및 B)는 다음 논리를 사용하여 다시 작성할 수 있습니다.
- ㄴ: (?:(?<=w)(?!w)|(?
- B: (?:(?<=w)(?= w)|(?
Java 수정 Java:
이 함수는 원래 토론 스레드에 제공된 코드를 사용하여 Java로 구현할 수 있습니다. 이 코드를 사용하면 정규식 패턴을 다시 작성하여 유니코드 문자를 더 잘 처리할 수 있습니다.
참고:
Java 7에서 Pattern 클래스는 UNICODE_CHARACTER_CLASS 플래그를 도입하여 유니코드 문자 지원을 활성화합니다. 이는 기본적으로 이스케이프됩니다.
위 내용은 \w 및 \b에 대한 Java 정규식의 유니코드 지원을 어떻게 향상시킬 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

일부 애플리케이션이 제대로 작동하지 않는 회사의 보안 소프트웨어에 대한 문제 해결 및 솔루션. 많은 회사들이 내부 네트워크 보안을 보장하기 위해 보안 소프트웨어를 배포 할 것입니다. ...

많은 응용 프로그램 시나리오에서 정렬을 구현하기 위해 이름으로 이름을 변환하는 솔루션, 사용자는 그룹으로, 특히 하나로 분류해야 할 수도 있습니다.

시스템 도킹의 필드 매핑 처리 시스템 도킹을 수행 할 때 어려운 문제가 발생합니다. 시스템의 인터페이스 필드를 효과적으로 매핑하는 방법 ...

데이터베이스 작업에 MyBatis-Plus 또는 기타 ORM 프레임 워크를 사용하는 경우 엔티티 클래스의 속성 이름을 기반으로 쿼리 조건을 구성해야합니다. 매번 수동으로 ...

IntellijideAultimate 버전을 사용하여 봄을 시작하십시오 ...

Java 객체 및 배열의 변환 : 캐스트 유형 변환의 위험과 올바른 방법에 대한 심층적 인 논의 많은 Java 초보자가 객체를 배열로 변환 할 것입니다 ...

Redis 캐싱 솔루션은 제품 순위 목록의 요구 사항을 어떻게 인식합니까? 개발 과정에서 우리는 종종 a ... 표시와 같은 순위의 요구 사항을 처리해야합니다.

전자 상거래 플랫폼에서 SKU 및 SPU 테이블의 디자인에 대한 자세한 설명이 기사는 전자 상거래 플랫폼에서 SKU 및 SPU의 데이터베이스 설계 문제, 특히 사용자 정의 판매를 처리하는 방법에 대해 논의 할 것입니다 ...
