ホームページ Java &#&チュートリアル Javaの正規表現でリストをフィルタリングします

Javaの正規表現でリストをフィルタリングします

Mar 07, 2025 pm 06:08 PM

Javaの正規表現でリストをフィルタリングする

この質問では、Javaの正規表現機能を効果的に活用して、リスト内の要素をフィルタリングする方法を探ります。 コアアプローチでは、リストを介して反復し、

およびjava.util.regex.Patternクラスを使用して各要素に正規表現パターンを適用することが含まれます。 これを効率的に、ストリームを使用して最新のJavaで読みやすさとパフォーマンスを向上させます。java.util.regex.Matcher

文字列のリストを考えてみましょう。 次のコードは、これをストリームと正規表現を使用して示しています。

List<String> strings = Arrays.asList("apple pie", "banana bread", "cherry cake", "apple crumble", "orange juice");
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
このコードは、最初に正規表現パターンをコンパイルします。これは、各要素の再コンパイルを避けるため、重要な最適化ステップです。次に、リストを繰り返してストリームを使用します。

操作は、パターンが文字列内で見つかった場合に

を使用して各文字列にコンパイルされたパターンを適用します。最後に、フィルタリングされた要素を新しいリストに収集します。 このアプローチは、中程度のサイズのリストでは簡潔で効率的です。 非常に大きなリストについては、平行ストリーム(パフォーマンスセクションでカバー)を検討してください。
Pattern pattern = Pattern.compile("apple"); // Compile the regex pattern once for efficiency

List<String> filteredList = strings.stream()
    .filter(s -> pattern.matcher(s).find())
    .collect(Collectors.toList());

System.out.println(filteredList); // Output: [apple pie, apple crumble]
ログイン後にコピー

特定のパターンに合わせて正規表現を使用してJavaリストを効率的にフィルタリングするにはどうすればよいですか? 主な最適化は次のとおりです

  • パターンを一度コンパイルします。 繰り返しの編集は、重要なパフォーマンスボトルネックです。 上記の例は、このベストプラクティスを紹介しています。
  • は、ストリームを使用します(非常に大きなリストには注意してください):Javaストリームは、コレクションを処理するための簡潔でしばしば効率的な方法を提供します。ストリーム内の操作により、正規表現のマッチングをエレガントに適用できます。 ただし、非常に大きなデータセットの場合、並列ストリームを考慮する必要があります。filter
  • 適切なregex:ニーズに合わせて最も効率的な正規表現パターンを選択します。 一致時間が遅くなる可能性のある過度に複雑なパターンまたは曖昧なパターンを避けてください。 キャラクタークラス()または数量化剤([abc]* )を使用して、正規表現のパフォーマンスを最適化するために慎重に使用することを検討してください。これにより、より高価なRegexエンジンで処理する必要がある文字列の数を大幅に削減できます。 たとえば、ターゲット文字列が特定の文字から始まることを知っている場合は、regexを適用する前にその文字の予備チェックを追加します。 例外処理のためのベストプラクティスは次のとおりです
    • 入力検証:正規式を適用する前に入力文字列を検証します。 これにより、予期しないキャラクターやパターンがPatternSyntaxException(正規表現が無効である場合にスローされる)を防ぐことができます。 この検証には、null値または空の文字列のチェックが含まれる場合があります。
    • try-catchブロック(特異性を備えた):PatternSyntaxExceptiontry-catchが最も一般的な例外ですが、Acatch (Exception e)ブロックを使用して潜在的な例外を処理することを検討してください。 汎用PatternSyntaxExceptionの代わりに、特定の例外タイプ(
    • )をキャッチして、より良いエラー処理とデバッグを行います。これにより、アプリケーションの動作をデバッグおよび監視するための貴重な情報が提供されます。 ログに問題のある文字列や例外メッセージなどの詳細を含めます。
    • ディフェンシブプログラミング:
    • アプリケーションをクラッシュせずに例外を優雅に処理するエラー処理メカニズムを実装します。 これには、問題のある文字列のスキップ、エラーのログ、またはデフォルト値の返品が含まれる場合があります。 たとえば、トライキャッチ内で正規表現を使用して大規模なJavaリストをフィルタリングする場合は、正規表現を使用する場合のパフォーマンスに関する考慮事項はありますか?
    • 正規表現を備えた大規模な表現のフィルタリングをパフォーマンスに依存させる方法をフィルタリングする場合は、パフォーマンスの考慮事項があります。 重要な懸念は次のとおりです。
    List<String> strings = Arrays.asList("apple pie", "banana bread", "cherry cake", "apple crumble", "orange juice");
    ログイン後にコピー
    ログイン後にコピー
    ログイン後にコピー

    スケーラビリティ:

    リストを介した反復の線形性は、非常に大きなデータセットのボトルネックになる可能性があります。 よりシンプルでターゲットを絞った表現は重要です。

    • 平行ストリーム:大規模なリストの場合、平行ストリームを活用するとパフォーマンスが大幅に向上します。 Javaの平行ストリームは、複数のスレッドに作業を分割し、リスト要素の同時処理を可能にします。
      • 並列ストリーム:操作の前に.parallel().filter()
      List<String> strings = Arrays.asList("apple pie", "banana bread", "cherry cake", "apple crumble", "orange juice");
      ログイン後にコピー
      ログイン後にコピー
      ログイン後にコピー
      • チャンキング(極端なケースの場合)を追加して
      • プロファイリング:
      • プロファイリングツールを使用して、パフォーマンスボトルネックを識別します。 これにより、正規表現そのものであろうと全体的な処理戦略であろうと、最適化のために領域を特定するのに役立ちます。 String.contains()代替アルゴリズム(可能であれば):
      • フィルタリング基準が許可されている場合は、代替の潜在的に高速なアルゴリズムを検討します。たとえば、パターンが単にサブストリングの存在をチェックしている場合、
      を使用することは正規表現よりも高速になります。

      選択したアプローチを慎重にベンチマークして、特定のユースケースとデータのために実際に速くなることを忘れないでください。 最適なソリューションは、リストのサイズ、正規表現の複雑さ、利用可能なハードウェアリソースに大きく依存します。

      以上がJavaの正規表現でリストをフィルタリングしますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

会社のセキュリティソフトウェアはアプリケーションの実行に失敗していますか?それをトラブルシューティングと解決する方法は? 会社のセキュリティソフトウェアはアプリケーションの実行に失敗していますか?それをトラブルシューティングと解決する方法は? Apr 19, 2025 pm 04:51 PM

一部のアプリケーションが適切に機能しないようにする会社のセキュリティソフトウェアのトラブルシューティングとソリューション。多くの企業は、内部ネットワークセキュリティを確保するためにセキュリティソフトウェアを展開します。 ...

名前を数値に変換してソートを実装し、グループの一貫性を維持するにはどうすればよいですか? 名前を数値に変換してソートを実装し、グループの一貫性を維持するにはどうすればよいですか? Apr 19, 2025 pm 11:30 PM

多くのアプリケーションシナリオでソートを実装するために名前を数値に変換するソリューションでは、ユーザーはグループ、特に1つでソートする必要がある場合があります...

MapsTructを使用したシステムドッキングのフィールドマッピングの問題を簡素化する方法は? MapsTructを使用したシステムドッキングのフィールドマッピングの問題を簡素化する方法は? Apr 19, 2025 pm 06:21 PM

システムドッキングでのフィールドマッピング処理は、システムドッキングを実行する際に難しい問題に遭遇することがよくあります。システムのインターフェイスフィールドを効果的にマッピングする方法A ...

エンティティクラス変数名をエレガントに取得して、データベースクエリ条件を構築する方法は? エンティティクラス変数名をエレガントに取得して、データベースクエリ条件を構築する方法は? Apr 19, 2025 pm 11:42 PM

データベース操作にMyBatis-Plusまたはその他のORMフレームワークを使用する場合、エンティティクラスの属性名に基づいてクエリ条件を構築する必要があることがよくあります。あなたが毎回手動で...

Intellijのアイデアは、ログを出力せずにSpring Bootプロジェクトのポート番号をどのように識別しますか? Intellijのアイデアは、ログを出力せずにSpring Bootプロジェクトのポート番号をどのように識別しますか? Apr 19, 2025 pm 11:45 PM

intellijideaultimatiateバージョンを使用してスプリングを開始します...

Javaオブジェクトを配列に安全に変換する方法は? Javaオブジェクトを配列に安全に変換する方法は? Apr 19, 2025 pm 11:33 PM

Javaオブジェクトと配列の変換:リスクの詳細な議論と鋳造タイプ変換の正しい方法多くのJava初心者は、オブジェクトのアレイへの変換に遭遇します...

eコマースプラットフォームSKUおよびSPUデータベースデザイン:ユーザー定義の属性と原因のない製品の両方を考慮する方法は? eコマースプラットフォームSKUおよびSPUデータベースデザイン:ユーザー定義の属性と原因のない製品の両方を考慮する方法は? Apr 19, 2025 pm 11:27 PM

eコマースプラットフォーム上のSKUおよびSPUテーブルの設計の詳細な説明この記事では、eコマースプラットフォームでのSKUとSPUのデータベース設計の問題、特にユーザー定義の販売を扱う方法について説明します。

Redisキャッシュソリューションを使用して、製品ランキングリストの要件を効率的に実現する方法は? Redisキャッシュソリューションを使用して、製品ランキングリストの要件を効率的に実現する方法は? Apr 19, 2025 pm 11:36 PM

Redisキャッシュソリューションは、製品ランキングリストの要件をどのように実現しますか?開発プロセス中に、多くの場合、ランキングの要件に対処する必要があります。

See all articles