ホームページ バックエンド開発 PHPチュートリアル PHP での機械学習: Rubix ML を使用してニュース分類器を構築する

PHP での機械学習: Rubix ML を使用してニュース分類器を構築する

Nov 03, 2024 am 03:33 AM

Machine Learning in PHP: Build a News Classifier Using Rubix ML

導入

機械学習はあらゆるところに使われており、映画の推奨、画像のタグ付け、そして今ではニュース記事の分類にも使用されています。 PHP 内でそれができるかどうか想像してみてください。 Rubix ML を使用すると、簡単でアクセスしやすい方法で機械学習のパワーを PHP に導入できます。このガイドでは、記事を「スポーツ」や「テクノロジー」などのカテゴリに分類する簡単なニュース分類子を構築する手順を説明します。最終的には、新しい記事の内容に基づいてカテゴリを予測できる実用的な分類器が完成します。

このプロジェクトは、PHP を使用した機械学習に少し足を踏み入れたい初心者に最適で、GitHub で完全なコードに従うことができます。

目次

  1. Rubix ML とは何ですか?
  2. プロジェクトのセットアップ
  3. ニュース分類クラスの作成
  4. モデルのトレーニング
  5. 新しいサンプルの予測
  6. 最終的な感想

Rubix MLとは何ですか?

Rubix ML は、ML ツールとアルゴリズムを PHP に適した環境に組み込む、PHP 用の機械学習ライブラリです。分類、回帰、クラスタリング、さらには自然言語処理に取り組んでいる場合でも、Rubix ML が対応します。これにより、データのロードと前処理、モデルのトレーニング、パフォーマンスの評価をすべて PHP で行うことができます。

Rubix ML は、次のような幅広い機械学習タスクをサポートします。

  • 分類: 電子メールをスパムまたはスパムではないというラベル付けなど、データを分類します。
  • 回帰: 住宅価格などの連続値を予測します。
  • クラスタリング: 顧客セグメントの検索など、ラベルを付けずにデータをグループ化します。
  • 自然言語処理 (NLP): テキスト データのトークン化や ML で使用可能な形式への変換などの作業。

Rubix ML を使用して、PHP で単純なニュース分類子を構築する方法を詳しく見てみましょう!

プロジェクトのセットアップ

まず、Rubix ML を使用して新しい PHP プロジェクトをセットアップし、自動読み込みを構成します。

ステップ 1: プロジェクト ディレクトリを初期化する

新しいプロジェクト ディレクトリを作成し、そこに移動します:

mkdir NewsClassifier
cd NewsClassifier
ログイン後にコピー
ログイン後にコピー

ステップ 2: Composer を使用して Rubix ML をインストールする

Composer がインストールされていることを確認し、次のコマンドを実行して Rubix ML をプロジェクトに追加します。

composer require rubix/ml
ログイン後にコピー
ログイン後にコピー

ステップ 3:composer.json で自動ロードを構成する

プロジェクトの src ディレクトリからクラスを自動ロードするには、composer.json ファイルを開くか作成し、次の構成を追加します。

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}
ログイン後にコピー
ログイン後にコピー

これは、NewsClassifier 名前空間の下の src フォルダー内のクラスを自動ロードするように Composer に指示します。

ステップ 4: Composer 自動ロード ダンプを実行する

オートロード構成を追加した後、次のコマンドを実行して Composer のオートローダーを再生成します。

mkdir NewsClassifier
cd NewsClassifier
ログイン後にコピー
ログイン後にコピー

ステップ 5: ディレクトリ構造

プロジェクト ディレクトリは次のようになります:

composer require rubix/ml
ログイン後にコピー
ログイン後にコピー
  • src/: PHP スクリプトが含まれます。
  • storage/: トレーニングされたモデルが保存される場所。
  • vendor/: Composer によってインストールされた依存関係が含まれます。

ニュース分類クラスの作成

src/ で、Classification.php というファイルを作成します。このファイルには、モデルをトレーニングし、ニュース カテゴリを予測するためのメソッドが含まれます。

{
    "autoload": {
        "psr-4": {
            "NewsClassifier\": "src/"
        }
    },
    "require": {
        "rubix/ml": "^2.5"
    }
}
ログイン後にコピー
ログイン後にコピー

この分類クラスには次のメソッドが含まれています:

  • トレーニング: パイプラインベースのモデルを作成してトレーニングします。
  • モデルを保存: トレーニングされたモデルを指定されたパスに保存します。
  • 予測: 保存されたモデルをロードし、新しいサンプルのカテゴリを予測します。

モデルのトレーニング

モデルをトレーニングするために、src/ に train.php というスクリプトを作成します。

composer dump-autoload
ログイン後にコピー

次のスクリプトを実行してモデルをトレーニングします:

NewsClassifier/
├── src/
│   ├── Classification.php
│   └── train.php
├── storage/
├── vendor/
├── composer.json
└── composer.lock
ログイン後にコピー

成功すると、以下が表示されます:

<?php

namespace NewsClassifier;

use Rubix\ML\Classifiers\KNearestNeighbors;
use Rubix\ML\Datasets\Labeled;
use Rubix\ML\Datasets\Unlabeled;
use Rubix\ML\PersistentModel;
use Rubix\ML\Pipeline;
use Rubix\ML\Tokenizers\Word;
use Rubix\ML\Transformers\TfIdfTransformer;
use Rubix\ML\Transformers\WordCountVectorizer;
use Rubix\ML\Persisters\Filesystem;

class Classification
{
    private $modelPath;

    public function __construct($modelPath)
    {
        $this->modelPath = $modelPath;
    }

    public function train()
    {
        // Sample data and corresponding labels
        $samples = [
            ['The team played an amazing game of soccer'],
            ['The new programming language has been released'],
            ['The match between the two teams was incredible'],
            ['The new tech gadget has been launched'],
        ];

        $labels = [
            'sports',
            'technology',
            'sports',
            'technology',
        ];

        // Create a labeled dataset
        $dataset = new Labeled($samples, $labels);

        // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier
        $estimator = new Pipeline([
            new WordCountVectorizer(10000, 1, 1, new Word()),
            new TfIdfTransformer(),
        ], new KNearestNeighbors(4));

        // Train the model
        $estimator->train($dataset);

        // Save the model
        $this->saveModel($estimator);

        echo "Training completed and model saved.\n";
    }

    private function saveModel($estimator)
    {
        $persister = new Filesystem($this->modelPath);
        $model = new PersistentModel($estimator, $persister);
        $model->save();
    }

    public function predict(array $samples)
    {
        // Load the saved model
        $persister = new Filesystem($this->modelPath);
        $model = PersistentModel::load($persister);

        // Predict categories for new samples
        $dataset = new Unlabeled($samples);
        return $model->predict($dataset);
    }
}
ログイン後にコピー

新しいサンプルの予測

トレーニングされたモデルに基づいて新しい記事を分類するために、src/ に別のスクリプト、predict.php を作成します。

<?php

require __DIR__ . '/../vendor/autoload.php';

use NewsClassifier\Classification;

// Define the model path
$modelPath = __DIR__ . '/../storage/model.rbx';

// Initialize the Classification object
$classifier = new Classification($modelPath);

// Train the model and save it
$classifier->train();
ログイン後にコピー

予測スクリプトを実行してサンプルを分類します:

php src/train.php
ログイン後にコピー

出力には、各サンプル テキストとその予測されたカテゴリが表示されます。

最終的な考え

このガイドでは、Rubix ML を使用して PHP で単純なニュース分類器を構築することに成功しました。これは、PHP が想像以上に多用途であり、テキスト分類や推奨システムなどのタスクに機械学習機能を組み込むことができることを示しています。このプロジェクトの完全なコードは GitHub で入手できます。

さまざまなアルゴリズムやデータを試して、分類器を拡張します。 PHP で機械学習ができるなんて誰が知っていたでしょうか?さあ、そうしましょう。
コーディングを楽しんでください!

以上がPHP での機械学習: Rubix ML を使用してニュース分類器を構築するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

PHP:Web開発の重要な言語 PHP:Web開発の重要な言語 Apr 13, 2025 am 12:08 AM

PHPは、サーバー側で広く使用されているスクリプト言語で、特にWeb開発に適しています。 1.PHPは、HTMLを埋め込み、HTTP要求と応答を処理し、さまざまなデータベースをサポートできます。 2.PHPは、ダイナミックWebコンテンツ、プロセスフォームデータ、アクセスデータベースなどを生成するために使用され、強力なコミュニティサポートとオープンソースリソースを備えています。 3。PHPは解釈された言語であり、実行プロセスには語彙分析、文法分析、編集、実行が含まれます。 4.PHPは、ユーザー登録システムなどの高度なアプリケーションについてMySQLと組み合わせることができます。 5。PHPをデバッグするときは、error_reporting()やvar_dump()などの関数を使用できます。 6. PHPコードを最適化して、キャッシュメカニズムを使用し、データベースクエリを最適化し、組み込み関数を使用します。 7

PHPでの安全なパスワードハッシュ(例:Password_hash、password_verify)を説明します。 MD5またはSHA1を使用してみませんか? PHPでの安全なパスワードハッシュ(例:Password_hash、password_verify)を説明します。 MD5またはSHA1を使用してみませんか? Apr 17, 2025 am 12:06 AM

PHPでは、Password_hashとpassword_verify関数を使用して安全なパスワードハッシュを実装する必要があり、MD5またはSHA1を使用しないでください。 1)password_hashセキュリティを強化するために、塩値を含むハッシュを生成します。 2)password_verifyハッシュ値を比較して、パスワードを確認し、セキュリティを確保します。 3)MD5とSHA1は脆弱であり、塩の値が不足しており、最新のパスワードセキュリティには適していません。

PHPとPython:2つの一般的なプログラミング言語を比較します PHPとPython:2つの一般的なプログラミング言語を比較します Apr 14, 2025 am 12:13 AM

PHPとPythonにはそれぞれ独自の利点があり、プロジェクトの要件に従って選択します。 1.PHPは、特にWebサイトの迅速な開発とメンテナンスに適しています。 2。Pythonは、データサイエンス、機械学習、人工知能に適しており、簡潔な構文を備えており、初心者に適しています。

アクション中のPHP:実際の例とアプリケーション アクション中のPHP:実際の例とアプリケーション Apr 14, 2025 am 12:19 AM

PHPは、電子商取引、コンテンツ管理システム、API開発で広く使用されています。 1)eコマース:ショッピングカート機能と支払い処理に使用。 2)コンテンツ管理システム:動的コンテンツの生成とユーザー管理に使用されます。 3)API開発:RESTFUL API開発とAPIセキュリティに使用されます。パフォーマンスの最適化とベストプラクティスを通じて、PHPアプリケーションの効率と保守性が向上します。

スカラータイプ、リターンタイプ、ユニオンタイプ、ヌル可能なタイプなど、PHPタイプのヒントはどのように機能しますか? スカラータイプ、リターンタイプ、ユニオンタイプ、ヌル可能なタイプなど、PHPタイプのヒントはどのように機能しますか? Apr 17, 2025 am 12:25 AM

PHPタイプは、コードの品質と読みやすさを向上させるためのプロンプトがあります。 1)スカラータイプのヒント:php7.0であるため、基本データ型は、int、floatなどの関数パラメーターで指定できます。 3)ユニオンタイプのプロンプト:PHP8.0であるため、関数パラメーターまたは戻り値で複数のタイプを指定することができます。 4)Nullable Typeプロンプト:null値を含めることができ、null値を返す可能性のある機能を処理できます。

PHPの永続的な関連性:それはまだ生きていますか? PHPの永続的な関連性:それはまだ生きていますか? Apr 14, 2025 am 12:12 AM

PHPは依然として動的であり、現代のプログラミングの分野で重要な位置を占めています。 1)PHPのシンプルさと強力なコミュニティサポートにより、Web開発で広く使用されています。 2)その柔軟性と安定性により、Webフォーム、データベース操作、ファイル処理の処理において顕著になります。 3)PHPは、初心者や経験豊富な開発者に適した、常に進化し、最適化しています。

PHPおよびPython:さまざまなパラダイムが説明されています PHPおよびPython:さまざまなパラダイムが説明されています Apr 18, 2025 am 12:26 AM

PHPは主に手順プログラミングですが、オブジェクト指向プログラミング(OOP)もサポートしています。 Pythonは、OOP、機能、手続き上のプログラミングなど、さまざまなパラダイムをサポートしています。 PHPはWeb開発に適しており、Pythonはデータ分析や機械学習などのさまざまなアプリケーションに適しています。

PHP対その他の言語:比較 PHP対その他の言語:比較 Apr 13, 2025 am 12:19 AM

PHPは、特に迅速な開発や動的なコンテンツの処理に適していますが、データサイエンスとエンタープライズレベルのアプリケーションには良くありません。 Pythonと比較して、PHPはWeb開発においてより多くの利点がありますが、データサイエンスの分野ではPythonほど良くありません。 Javaと比較して、PHPはエンタープライズレベルのアプリケーションでより悪化しますが、Web開発により柔軟性があります。 JavaScriptと比較して、PHPはバックエンド開発により簡潔ですが、フロントエンド開発のJavaScriptほど良くありません。

See all articles