目次
はじめに
線形回帰モデル - LinearRegression
データセットの準備
線形回帰を使用する
ホームページ バックエンド開発 Python チュートリアル Python で scikit-learn 機械学習ライブラリを使用する方法。

Python で scikit-learn 機械学習ライブラリを使用する方法。

Apr 22, 2023 pm 10:31 PM
python scikit-learn

はじめに

scikit-learn は、Python で最も人気のある機械学習ライブラリの 1 つで、分類、回帰、クラスタリング、次元削減などのさまざまな機械学習アルゴリズムとツールを提供します。

scikit-learn の利点は次のとおりです:

  • 使いやすい: scikit-learn のインターフェイスはシンプルで理解しやすいため、ユーザーは簡単に使い始めることができます。機械学習。統一された API: scikit-learn の API は非常に統一されており、さまざまなアルゴリズムの使用方法は基本的に同じであるため、学習と使用がより便利になります。

  • 多数の機械学習アルゴリズムの実装: scikit-learn は、さまざまな古典的な機械学習アルゴリズムを実装し、豊富なツールと機能を提供して、アルゴリズムのデバッグと最適化をより便利にします。

  • オープンソースで無料: scikit-learn は完全にオープンソースで無料であり、誰でもそのコードを使用および変更できます。

  • 効率的で安定した: scikit-learn は、さまざまな効率的な機械学習アルゴリズムを実装し、大規模なデータセットを処理でき、安定性と信頼性の点で優れたパフォーマンスを発揮します。 scikit-learn は、API が非常に統合されており、モデルが比較的シンプルであるため、初心者レベルの機械学習に非常に適しています。ここでのお勧めは、各モデルの適用範囲を紹介するだけでなく、コードサンプルも提供されている公式ドキュメントと合わせて学習することです。

線形回帰モデル - LinearRegression

LinearRegression モデルは、線形回帰に基づくモデルであり、連続変数の予測問題を解くのに適しています。このモデルの基本的な考え方は、線形方程式を確立し、独立変数と従属変数の間の関係を直線としてモデル化し、トレーニング データを使用して直線をフィッティングして線形方程式の係数を見つけることです。次に、この方程式を使用して、予測用のデータをテストします。

線形回帰モデルは、住宅価格予測、売上予測、ユーザー行動予測など、独立変数と従属変数の間に線形関係がある問題に適しています。もちろん、独立変数と従属変数の間の関係が非線形の場合、LinearRegression モデルのパフォーマンスは低下します。このとき、多項式回帰、リッジ回帰、ラッソ回帰などの手法を使用して問題を解決できます。

データセットの準備

他の要因の影響を脇に置いた後、学習時間と学習パフォーマンスの間には一定の線形関係があります。もちろん、ここでの学習時間は効果的な学習を指します。時間、成績 勉強時間が増えると成績も上がります。そこで、学習時間と成績のデータセットを用意します。データセット内のデータの一部は次のとおりです:

学習時間、スコア
0.5,15
0.75,23
1.0,14
1.25,42
1.5,21
1.75,28
1.75,35
2.0,51
2.25,61
2.5,49

線形回帰を使用する

特徴量の合計を決定する 目標

学習時間と成績の間では、学習時間は独立変数である特徴であり、成績は従属変数であるラベルであるため、特徴量と成績を抽出する必要があります。準備された学習時間と成績のデータセットからラベルを取得します。

import pandas as pd
import numpy as np
from sklearn.metrics import r2_score, mean_squared_error
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
# 读取学习时间和成绩CSV数据文件
data = pd.read_csv('data/study_time_score.csv')
# 提取数据特征学习时间
X = data['学习时间']
# 提取数据目标(标签)分数
Y = data['分数']
ログイン後にコピー

トレーニング セットとテスト セットを分割する

特徴データとラベル データが準備できたら、scikit-learn の LinearRegression をトレーニングに使用し、データ セットをトレーニング セットとテスト セットに分割します。 。

"""
将特征数据和目标数据划分为测试集和训练集
通过test_size=0.25将百分之二十五的数据划分为测试集
"""
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.25, random_state=0)
x_train = X_train.values.reshape(-1, 1)
model.fit(x_train, Y_train)
ログイン後にコピー

モデルを選択してデータを当てはめる

テスト セットとトレーニング セットを準備した後、トレーニング セットに適合する適切なモデルを選択できるため、他のターゲットに対応するターゲットを予測できます。機能

# 选择模型,选择模型为LinearRegression
model = LinearRegression()
# Scikit-learn中,机器学习模型的输入必须是一个二维数组。我们需要将一维数组转换为二维数组,才能在模型中使用。
x_train = X_train.values.reshape(-1, 1)
# 进行拟合
model.fit(x_train, Y_train)
ログイン後にコピー

モデル パラメーターの取得

データ セットには 2 つの学習時間と成績のみが含まれているため、非常に単純な線形モデルであり、その背後にある数式は y=ax b です。 , ここで、y 従属変数は成績、x 独立変数は学習時間です。

"""
输出模型关键参数
Intercept: 截距 即b
Coefficients: 变量权重 即a
"""
print('Intercept:', model.intercept_)
print('Coefficients:', model.coef_)
ログイン後にコピー

バックテスト

上記のフィッティング モデルでは、テスト セット データのみが使用されています。次に、テスト セット データを使用して、モデルのフィッティングに関するバックテストを実行する必要があります。トレーニングを使用した後、に設定すると、特徴テストセットを予測でき、得られたターゲット予測結果と実際のターゲット値を比較することで、モデルの適合度を取得できます。

# 转换为n行1列的二维数组
x_test = X_test.values.reshape(-1, 1)
# 在测试集上进行预测并计算评分
Y_pred = model.predict(x_test)
# 打印测试特征数据
print(x_test)
# 打印特征数据对应的预测结果
print(Y_pred)
# 将预测结果与原特征数据对应的实际目标值进行比较,从而获得模型拟合度
# R2 (R-squared):模型拟合优度,取值范围在0~1之间,越接近1表示模型越好的拟合了数据。
print("R2:", r2_score(Y_test, Y_pred))
ログイン後にコピー
  • プログラムの実行結果

  • 上記のコードに従って、LinearRegression モデルの適合度を判断する必要があります。つまり、データが適切かどうか。フィッティングには線形モデルを使用します。プログラムの実行結果は次のとおりです。

##予測結果:

[47.43726068 33.05457106 49.83437561 63.41802692 41.84399249 37.84880093
23.46611131 37. 84880093 26.66226456 71.40841004 18.67188144 88.9872529
63.41802692 42.6430308 21.86803469 6 9.81033341 66.61418017 33.05457106
58.62379705 50.63341392 18.67188144 41.044954 0 .8935675710322939

以上がPython で scikit-learn 機械学習ライブラリを使用する方法。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

PHPおよびPython:さまざまなパラダイムが説明されています PHPおよびPython:さまざまなパラダイムが説明されています Apr 18, 2025 am 12:26 AM

PHPは主に手順プログラミングですが、オブジェクト指向プログラミング(OOP)もサポートしています。 Pythonは、OOP、機能、手続き上のプログラミングなど、さまざまなパラダイムをサポートしています。 PHPはWeb開発に適しており、Pythonはデータ分析や機械学習などのさまざまなアプリケーションに適しています。

PHPとPythonの選択:ガイド PHPとPythonの選択:ガイド Apr 18, 2025 am 12:24 AM

PHPはWeb開発と迅速なプロトタイピングに適しており、Pythonはデータサイエンスと機械学習に適しています。 1.PHPは、単純な構文と迅速な開発に適した動的なWeb開発に使用されます。 2。Pythonには簡潔な構文があり、複数のフィールドに適しており、強力なライブラリエコシステムがあります。

Sublime Code Pythonを実行する方法 Sublime Code Pythonを実行する方法 Apr 16, 2025 am 08:48 AM

PythonコードをSublimeテキストで実行するには、最初にPythonプラグインをインストールし、次に.pyファイルを作成してコードを書き込み、Ctrl Bを押してコードを実行する必要があります。コードを実行すると、出力がコンソールに表示されます。

PHPとPython:彼らの歴史を深く掘り下げます PHPとPython:彼らの歴史を深く掘り下げます Apr 18, 2025 am 12:25 AM

PHPは1994年に発信され、Rasmuslerdorfによって開発されました。もともとはウェブサイトの訪問者を追跡するために使用され、サーバー側のスクリプト言語に徐々に進化し、Web開発で広く使用されていました。 Pythonは、1980年代後半にGuidovan Rossumによって開発され、1991年に最初にリリースされました。コードの読みやすさとシンプルさを強調し、科学的コンピューティング、データ分析、その他の分野に適しています。

Python vs. JavaScript:学習曲線と使いやすさ Python vs. JavaScript:学習曲線と使いやすさ Apr 16, 2025 am 12:12 AM

Pythonは、スムーズな学習曲線と簡潔な構文を備えた初心者により適しています。 JavaScriptは、急な学習曲線と柔軟な構文を備えたフロントエンド開発に適しています。 1。Python構文は直感的で、データサイエンスやバックエンド開発に適しています。 2。JavaScriptは柔軟で、フロントエンドおよびサーバー側のプログラミングで広く使用されています。

Golang vs. Python:パフォーマンスとスケーラビリティ Golang vs. Python:パフォーマンスとスケーラビリティ Apr 19, 2025 am 12:18 AM

Golangは、パフォーマンスとスケーラビリティの点でPythonよりも優れています。 1)Golangのコンピレーションタイプの特性と効率的な並行性モデルにより、高い並行性シナリオでうまく機能します。 2)Pythonは解釈された言語として、ゆっくりと実行されますが、Cythonなどのツールを介してパフォーマンスを最適化できます。

vscodeでコードを書く場所 vscodeでコードを書く場所 Apr 15, 2025 pm 09:54 PM

Visual Studioコード(VSCODE)でコードを作成するのはシンプルで使いやすいです。 VSCODEをインストールし、プロジェクトの作成、言語の選択、ファイルの作成、コードの書き込み、保存して実行します。 VSCODEの利点には、クロスプラットフォーム、フリーおよびオープンソース、強力な機能、リッチエクステンション、軽量で高速が含まれます。

メモ帳でPythonを実行する方法 メモ帳でPythonを実行する方法 Apr 16, 2025 pm 07:33 PM

メモ帳でPythonコードを実行するには、Python実行可能ファイルとNPPEXECプラグインをインストールする必要があります。 Pythonをインストールしてパスを追加した後、nppexecプラグインでコマンド「python」とパラメーター "{current_directory} {file_name}"を構成して、メモ帳のショートカットキー「F6」を介してPythonコードを実行します。

See all articles