PHP 中的機器學習:使用 Rubix ML 建立新聞分類器
介紹
機器學習無所不在-推薦影片、標記影像,現在甚至將新聞文章分類。想像一下如果您可以在 PHP 中做到這一點!透過 Rubix ML,您可以以簡單易懂的方式將機器學習的強大功能引入 PHP。本指南將引導您建立一個簡單的新聞分類器,將文章分類為「體育」或「技術」等類別。最後,您將擁有一個工作分類器,可以根據新文章的內容預測其類別。
這個專案非常適合想要使用 PHP 進行機器學習的初學者,您可以按照 GitHub 上的完整程式碼進行操作。
目錄
- 什麼是 Rubix ML?
- 設定項目
- 建立新聞分類類
- 訓練模型
- 預測新樣本
- 最後的想法
Rubix 機器學習是什麼?
Rubix ML 是一個 PHP 機器學習函式庫,它將 ML 工具和演算法引入 PHP 友善的環境中。無論您從事分類、迴歸、聚類,甚至自然語言處理,Rubix ML 都能滿足您的需求。它允許您加載和預處理資料、訓練模型並評估效能——所有這些都在 PHP 中進行。
Rubix ML 支援廣泛的機器學習任務,例如:
- 分類:將資料分類,例如將電子郵件標記為垃圾郵件或非垃圾郵件。
- 迴歸:預測連續值,例如房價。
- 聚類:將沒有標籤的資料分組,就像尋找客戶群一樣。
- 自然語言處理 (NLP):處理文字數據,例如標記並將其轉換為 ML 可用的格式。
讓我們深入了解如何使用 Rubix ML 在 PHP 中建立簡單的新聞分類器!
設定項目
我們將首先使用 Rubix ML 設定一個新的 PHP 專案並配置自動載入。
步驟1:初始化專案目錄
建立一個新的專案目錄並導航到其中:
mkdir NewsClassifier cd NewsClassifier
第 2 步:安裝 Rubix ML 和 Composer
確保您已安裝 Composer,然後透過執行以下命令將 Rubix ML 新增至您的專案:
composer require rubix/ml
步驟3:在composer.json中配置自動加載
要從專案的 src 目錄自動載入類,請開啟或建立composer.json 檔案並新增以下配置:
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
這告訴 Composer 自動載入 NewsClassifier 命名空間下 src 資料夾中的任何類別。
步驟 4: 執行 Composer Autoload Dump
新增自動載入設定後,執行下列指令重新產生 Composer 的自動載入器:
mkdir NewsClassifier cd NewsClassifier
第5步:目錄結構
您的專案目錄應如下所示:
composer require rubix/ml
- src/:包含您的 PHP 腳本。
- storage/:訓練後的模型的保存位置。
- vendor/:包含 Composer 安裝的依賴項。
建立新聞分類類
在 src/ 中,建立一個名為 Classification.php 的檔案。該文件將包含訓練模型和預測新聞類別的方法。
{ "autoload": { "psr-4": { "NewsClassifier\": "src/" } }, "require": { "rubix/ml": "^2.5" } }
此分類類別包含以下方法:
- 訓練:建立並訓練基於管道的模型。
- 保存模型:將訓練好的模型儲存到指定路徑
- 預測:載入已儲存的模型並預測新樣本的類別。
訓練模型
在 src/ 中建立一個名為 train.php 的腳本來訓練模型。
composer dump-autoload
執行此腳本來訓練模型:
NewsClassifier/ ├── src/ │ ├── Classification.php │ └── train.php ├── storage/ ├── vendor/ ├── composer.json └── composer.lock
如果成功,您將看到:
<?php namespace NewsClassifier; use Rubix\ML\Classifiers\KNearestNeighbors; use Rubix\ML\Datasets\Labeled; use Rubix\ML\Datasets\Unlabeled; use Rubix\ML\PersistentModel; use Rubix\ML\Pipeline; use Rubix\ML\Tokenizers\Word; use Rubix\ML\Transformers\TfIdfTransformer; use Rubix\ML\Transformers\WordCountVectorizer; use Rubix\ML\Persisters\Filesystem; class Classification { private $modelPath; public function __construct($modelPath) { $this->modelPath = $modelPath; } public function train() { // Sample data and corresponding labels $samples = [ ['The team played an amazing game of soccer'], ['The new programming language has been released'], ['The match between the two teams was incredible'], ['The new tech gadget has been launched'], ]; $labels = [ 'sports', 'technology', 'sports', 'technology', ]; // Create a labeled dataset $dataset = new Labeled($samples, $labels); // Set up the pipeline with a text transformer and K-Nearest Neighbors classifier $estimator = new Pipeline([ new WordCountVectorizer(10000, 1, 1, new Word()), new TfIdfTransformer(), ], new KNearestNeighbors(4)); // Train the model $estimator->train($dataset); // Save the model $this->saveModel($estimator); echo "Training completed and model saved.\n"; } private function saveModel($estimator) { $persister = new Filesystem($this->modelPath); $model = new PersistentModel($estimator, $persister); $model->save(); } public function predict(array $samples) { // Load the saved model $persister = new Filesystem($this->modelPath); $model = PersistentModel::load($persister); // Predict categories for new samples $dataset = new Unlabeled($samples); return $model->predict($dataset); } }
預測新樣本
在 src/ 中建立另一個腳本,predict.php,根據訓練的模型對新文章進行分類。
<?php require __DIR__ . '/../vendor/autoload.php'; use NewsClassifier\Classification; // Define the model path $modelPath = __DIR__ . '/../storage/model.rbx'; // Initialize the Classification object $classifier = new Classification($modelPath); // Train the model and save it $classifier->train();
運行預測腳本對樣本進行分類:
php src/train.php
輸出應顯示每個範例文字及其預測類別。
最後的想法
透過本指南,您已經使用 Rubix ML 在 PHP 中成功建立了一個簡單的新聞分類器!這展示了 PHP 如何比您想像的更通用,為文字分類、推薦系統等任務引入機器學習功能。此專案的完整程式碼可在 GitHub 上取得。
嘗試不同的演算法或資料來擴展分類器。誰知道 PHP 可以進行機器學習?現在你知道了。
快樂編碼!
以上是PHP 中的機器學習:使用 Rubix ML 建立新聞分類器的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

在PHP中,應使用password_hash和password_verify函數實現安全的密碼哈希處理,不應使用MD5或SHA1。1)password_hash生成包含鹽值的哈希,增強安全性。 2)password_verify驗證密碼,通過比較哈希值確保安全。 3)MD5和SHA1易受攻擊且缺乏鹽值,不適合現代密碼安全。

PHP和Python各有優勢,選擇依據項目需求。 1.PHP適合web開發,尤其快速開發和維護網站。 2.Python適用於數據科學、機器學習和人工智能,語法簡潔,適合初學者。

PHP是一種廣泛應用於服務器端的腳本語言,特別適合web開發。 1.PHP可以嵌入HTML,處理HTTP請求和響應,支持多種數據庫。 2.PHP用於生成動態網頁內容,處理表單數據,訪問數據庫等,具有強大的社區支持和開源資源。 3.PHP是解釋型語言,執行過程包括詞法分析、語法分析、編譯和執行。 4.PHP可以與MySQL結合用於用戶註冊系統等高級應用。 5.調試PHP時,可使用error_reporting()和var_dump()等函數。 6.優化PHP代碼可通過緩存機制、優化數據庫查詢和使用內置函數。 7

PHP在電子商務、內容管理系統和API開發中廣泛應用。 1)電子商務:用於購物車功能和支付處理。 2)內容管理系統:用於動態內容生成和用戶管理。 3)API開發:用於RESTfulAPI開發和API安全性。通過性能優化和最佳實踐,PHP應用的效率和可維護性得以提升。

PHP類型提示提升代碼質量和可讀性。 1)標量類型提示:自PHP7.0起,允許在函數參數中指定基本數據類型,如int、float等。 2)返回類型提示:確保函數返回值類型的一致性。 3)聯合類型提示:自PHP8.0起,允許在函數參數或返回值中指定多個類型。 4)可空類型提示:允許包含null值,處理可能返回空值的函數。

PHP仍然具有活力,其在現代編程領域中依然佔據重要地位。 1)PHP的簡單易學和強大社區支持使其在Web開發中廣泛應用;2)其靈活性和穩定性使其在處理Web表單、數據庫操作和文件處理等方面表現出色;3)PHP不斷進化和優化,適用於初學者和經驗豐富的開發者。

PHP和Python各有優劣,選擇取決於項目需求和個人偏好。 1.PHP適合快速開發和維護大型Web應用。 2.Python在數據科學和機器學習領域佔據主導地位。

PHP適合web開發,特別是在快速開發和處理動態內容方面表現出色,但不擅長數據科學和企業級應用。與Python相比,PHP在web開發中更具優勢,但在數據科學領域不如Python;與Java相比,PHP在企業級應用中表現較差,但在web開發中更靈活;與JavaScript相比,PHP在後端開發中更簡潔,但在前端開發中不如JavaScript。
