PHP での機械学習: Rubix ML を使用してニュース分類器を構築する
導入
機械学習はあらゆるところに使われており、映画の推奨、画像のタグ付け、そして今ではニュース記事の分類にも使用されています。 PHP 内でそれができるかどうか想像してみてください。 Rubix ML を使用すると、簡単でアクセスしやすい方法で機械学習のパワーを PHP に導入できます。このガイドでは、記事を「スポーツ」や「テクノロジー」などのカテゴリに分類する簡単なニュース分類子を構築する手順を説明します。最終的には、新しい記事の内容に基づいてカテゴリを予測できる実用的な分類器が完成します。
このプロジェクトは、PHP を使用した機械学習に少し足を踏み入れたい初心者に最適で、GitHub で完全なコードに従うことができます。
目次
- Rubix ML とは何ですか?
- プロジェクトのセットアップ
- ニュース分類クラスの作成
- モデルのトレーニング
- 新しいサンプルの予測
- 最終的な感想
Rubix MLとは何ですか?
Rubix ML は、ML ツールとアルゴリズムを PHP に適した環境に組み込む、PHP 用の機械学習ライブラリです。分類、回帰、クラスタリング、さらには自然言語処理に取り組んでいる場合でも、Rubix ML が対応します。これにより、データのロードと前処理、モデルのトレーニング、パフォーマンスの評価をすべて PHP で行うことができます。
Rubix ML は、次のような幅広い機械学習タスクをサポートします。
- 分類: 電子メールをスパムまたはスパムではないというラベル付けなど、データを分類します。
- 回帰: 住宅価格などの連続値を予測します。
- クラスタリング: 顧客セグメントの検索など、ラベルを付けずにデータをグループ化します。
- 自然言語処理 (NLP): テキスト データのトークン化や ML で使用可能な形式への変換などの作業。
Rubix ML を使用して、PHP で単純なニュース分類子を構築する方法を詳しく見てみましょう!
プロジェクトのセットアップ
まず、Rubix ML を使用して新しい PHP プロジェクトをセットアップし、自動読み込みを構成します。
ステップ 1: プロジェクト ディレクトリを初期化する
新しいプロジェクト ディレクトリを作成し、そこに移動します:
mkdir NewsClassifier cd NewsClassifier
ステップ 2: Composer を使用して Rubix ML をインストールする
Composer がインストールされていることを確認し、次のコマンドを実行して Rubix ML をプロジェクトに追加します。
composer require rubix/ml
ステップ 3:composer.json で自動ロードを構成する
プロジェクトの src ディレクトリからクラスを自動ロードするには、composer.json ファイルを開くか作成し、次の構成を追加します。
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
これは、NewsClassifier 名前空間の下の src フォルダー内のクラスを自動ロードするように Composer に指示します。
ステップ 4: Composer 自動ロード ダンプを実行する
オートロード構成を追加した後、次のコマンドを実行して Composer のオートローダーを再生成します。
mkdir NewsClassifier cd NewsClassifier
ステップ 5: ディレクトリ構造
プロジェクト ディレクトリは次のようになります:
composer require rubix/ml
- src/: PHP スクリプトが含まれます。
- storage/: トレーニングされたモデルが保存される場所。
- vendor/: Composer によってインストールされた依存関係が含まれます。
ニュース分類クラスの作成
src/ で、Classification.php というファイルを作成します。このファイルには、モデルをトレーニングし、ニュース カテゴリを予測するためのメソッドが含まれます。
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
この分類クラスには次のメソッドが含まれています:
- トレーニング: パイプラインベースのモデルを作成してトレーニングします。
- モデルを保存: トレーニングされたモデルを指定されたパスに保存します。
- 予測: 保存されたモデルをロードし、新しいサンプルのカテゴリを予測します。
モデルのトレーニング
モデルをトレーニングするために、src/ に train.php というスクリプトを作成します。
composer dump-autoload
次のスクリプトを実行してモデルをトレーニングします:
NewsClassifier/ ├── src/ │ ├── Classification.php │ └── train.php ├── storage/ ├── vendor/ ├── composer.json └── composer.lock
成功すると、以下が表示されます:
<?php namespace NewsClassifier; use Rubix\ML\Classifiers\KNearestNeighbors; use Rubix\ML\Datasets\Labeled; use Rubix\ML\Datasets\Unlabeled; use Rubix\ML\PersistentModel; use Rubix\ML\Pipeline; use Rubix\ML\Tokenizers\Word; use Rubix\ML\Transformers\TfIdfTransformer; use Rubix\ML\Transformers\WordCountVectorizer; use Rubix\ML\Persisters\Filesystem; class Classification { private $modelPath; public function __construct($modelPath) { $this->modelPath = $modelPath; } public function train() { // Sample data and corresponding labels $samples = [ ['The team played an amazing game of soccer'], ['The new programming language has been released'], ['The match between the two teams was incredible'], ['The new tech gadget has been launched'], ]; $labels = [ 'sports', 'technology', 'sports', 'technology', ]; // Create a labeled dataset $dataset = new Labeled($samples, $labels); // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier $estimator = new Pipeline([ new WordCountVectorizer(10000, 1, 1, new Word()), new TfIdfTransformer(), ], new KNearestNeighbors(4)); // Train the model $estimator->train($dataset); // Save the model $this->saveModel($estimator); echo "Training completed and model saved.\n"; } private function saveModel($estimator) { $persister = new Filesystem($this->modelPath); $model = new PersistentModel($estimator, $persister); $model->save(); } public function predict(array $samples) { // Load the saved model $persister = new Filesystem($this->modelPath); $model = PersistentModel::load($persister); // Predict categories for new samples $dataset = new Unlabeled($samples); return $model->predict($dataset); } }
新しいサンプルの予測
トレーニングされたモデルに基づいて新しい記事を分類するために、src/ に別のスクリプト、predict.php を作成します。
<?php require __DIR__ . '/../vendor/autoload.php'; use NewsClassifier\Classification; // Define the model path $modelPath = __DIR__ . '/../storage/model.rbx'; // Initialize the Classification object $classifier = new Classification($modelPath); // Train the model and save it $classifier->train();
予測スクリプトを実行してサンプルを分類します:
php src/train.php
出力には、各サンプル テキストとその予測されたカテゴリが表示されます。
最終的な考え
このガイドでは、Rubix ML を使用して PHP で単純なニュース分類器を構築することに成功しました。これは、PHP が想像以上に多用途であり、テキスト分類や推奨システムなどのタスクに機械学習機能を組み込むことができることを示しています。このプロジェクトの完全なコードは GitHub で入手できます。
さまざまなアルゴリズムやデータを試して、分類器を拡張します。 PHP で機械学習ができるなんて誰が知っていたでしょうか?さあ、そうしましょう。
コーディングを楽しんでください!
以上がPHP での機械学習: Rubix ML を使用してニュース分類器を構築するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











PHPは、サーバー側で広く使用されているスクリプト言語で、特にWeb開発に適しています。 1.PHPは、HTMLを埋め込み、HTTP要求と応答を処理し、さまざまなデータベースをサポートできます。 2.PHPは、ダイナミックWebコンテンツ、プロセスフォームデータ、アクセスデータベースなどを生成するために使用され、強力なコミュニティサポートとオープンソースリソースを備えています。 3。PHPは解釈された言語であり、実行プロセスには語彙分析、文法分析、編集、実行が含まれます。 4.PHPは、ユーザー登録システムなどの高度なアプリケーションについてMySQLと組み合わせることができます。 5。PHPをデバッグするときは、error_reporting()やvar_dump()などの関数を使用できます。 6. PHPコードを最適化して、キャッシュメカニズムを使用し、データベースクエリを最適化し、組み込み関数を使用します。 7

PHPでは、Password_hashとpassword_verify関数を使用して安全なパスワードハッシュを実装する必要があり、MD5またはSHA1を使用しないでください。 1)password_hashセキュリティを強化するために、塩値を含むハッシュを生成します。 2)password_verifyハッシュ値を比較して、パスワードを確認し、セキュリティを確保します。 3)MD5とSHA1は脆弱であり、塩の値が不足しており、最新のパスワードセキュリティには適していません。

PHPとPythonにはそれぞれ独自の利点があり、プロジェクトの要件に従って選択します。 1.PHPは、特にWebサイトの迅速な開発とメンテナンスに適しています。 2。Pythonは、データサイエンス、機械学習、人工知能に適しており、簡潔な構文を備えており、初心者に適しています。

PHPは、電子商取引、コンテンツ管理システム、API開発で広く使用されています。 1)eコマース:ショッピングカート機能と支払い処理に使用。 2)コンテンツ管理システム:動的コンテンツの生成とユーザー管理に使用されます。 3)API開発:RESTFUL API開発とAPIセキュリティに使用されます。パフォーマンスの最適化とベストプラクティスを通じて、PHPアプリケーションの効率と保守性が向上します。

PHPタイプは、コードの品質と読みやすさを向上させるためのプロンプトがあります。 1)スカラータイプのヒント:php7.0であるため、基本データ型は、int、floatなどの関数パラメーターで指定できます。 3)ユニオンタイプのプロンプト:PHP8.0であるため、関数パラメーターまたは戻り値で複数のタイプを指定することができます。 4)Nullable Typeプロンプト:null値を含めることができ、null値を返す可能性のある機能を処理できます。

PHPは依然として動的であり、現代のプログラミングの分野で重要な位置を占めています。 1)PHPのシンプルさと強力なコミュニティサポートにより、Web開発で広く使用されています。 2)その柔軟性と安定性により、Webフォーム、データベース操作、ファイル処理の処理において顕著になります。 3)PHPは、初心者や経験豊富な開発者に適した、常に進化し、最適化しています。

PHPは主に手順プログラミングですが、オブジェクト指向プログラミング(OOP)もサポートしています。 Pythonは、OOP、機能、手続き上のプログラミングなど、さまざまなパラダイムをサポートしています。 PHPはWeb開発に適しており、Pythonはデータ分析や機械学習などのさまざまなアプリケーションに適しています。

PHPは、特に迅速な開発や動的なコンテンツの処理に適していますが、データサイエンスとエンタープライズレベルのアプリケーションには良くありません。 Pythonと比較して、PHPはWeb開発においてより多くの利点がありますが、データサイエンスの分野ではPythonほど良くありません。 Javaと比較して、PHPはエンタープライズレベルのアプリケーションでより悪化しますが、Web開発により柔軟性があります。 JavaScriptと比較して、PHPはバックエンド開発により簡潔ですが、フロントエンド開発のJavaScriptほど良くありません。
