Python で時系列データをリサンプリングする方法
時系列データは、一定の時間間隔で収集された一連の観測値です。データは、金融、経済、健康、環境科学など、あらゆる分野から取得できます。当社が収集する時系列データは、周波数や解像度が異なる場合があり、当社の分析およびデータ モデリング プロセスには適さない場合があります。この場合、アップサンプリングまたはダウンサンプリングによって時系列データをリサンプリングし、それによって時系列の周波数または解像度を変更できます。この記事では、時系列データをアップサンプリングまたはダウンサンプリングするさまざまな方法を紹介します。
アップサンプリング
アップサンプリングとは、時系列データの周波数を増やすことを意味します。これは通常、より高い解像度またはより頻繁な観測が必要な場合に行われます。Python には、線形内挿、最近隣内挿など、時系列データをアップサンプリングするためのいくつかの方法が用意されています。および多項式補間。
###構文### リーリー ここにあります、
- resample
関数は、時系列データをリサンプリングするために pandas ライブラリによって提供されるメソッドです。これは DataFrame に適用され、リサンプリングに必要な頻度を指定するルール パラメーターを受け取ります。引数 (*args) とキーワード引数 (**kwargs) を指定すると、集計方法の指定や欠損値の処理など、リサンプリング動作をカスタマイズできます。
asfreq メソッドは、時系列データの周波数を変換するために resample 関数と組み合わせて使用されます。このメソッドは、出力に必要な周波数文字列を指定する freq パラメーターを受け取ります。オプションのメソッド パラメーターを使用すると、前方充填、後方充填、補間など、リサンプリング プロセス中に導入された欠損値の処理方法を指定できます。
-
内挿法は、時系列データの欠損値やギャップを埋めるために使用されます。指定された方法 (「線形」、「最近接」、「スプライン」など) に従って補間して、既存の観測間の値を推定します。追加のパラメーターは、補間の軸、連続する NaN 値のパディング制限、およびデータフレームをその場で変更するか新しいデータフレームを返すかを制御できます。
###線形補間### 線形補間は、時系列データのアップサンプリングに使用されます。データポイント間に直線を引いてギャップを埋めます。線形補間は、pandas ライブラリの resample 関数を使用して実装できます。 -
Example
の中国語訳は次のとおりです: Example
以下の例では、不連続な日付の 3 つの観測値を含む時系列データフレームがあります。「日付」列を日時形式に変換し、インデックスとして設定します。データをアップサンプリングするためにリサンプル関数が使用されます。 asfreq メソッドを使用して毎日の頻度 (「D」) に変換します。最後に、'linear' オプションを指定した interpolate メソッドは、線形補間を使用してデータ ポイント間のギャップを埋めます。データフレーム df_upsampled には、補間値を含むアップサンプリングされた時系列データが含まれます.
リーリー ###出力### リーリー最近傍補間
最近傍補間は、データ ポイント間のギャップを最も近い利用可能な観測値で埋める単純な方法です。この方法は、時系列が急激な変化を示す場合、または観測の順序が重要な場合に役立ちます。パンダの補間メソッドは次のとおりです。最近傍補間を実行するには、「nearest」オプションとともに使用します。
Exampleの中国語訳は次のとおりです:
Example上の例では、前と同じ元のデータフレームを使用します。「D」周波数でリサンプリングした後、「最近接」オプションを指定した内挿メソッドは、利用可能な最も近い観測値をコピーすることによってギャップを埋めます。結果のデータフレーム、df_upsampledは、最近傍補間による毎日の頻度を持ちます。
リーリー ###出力### リーリー
ダウンサンプリングダウンサンプリングは、時系列データの頻度を減らすために使用され、通常はデータのより広い視野を取得したり、分析を簡素化したりするために使用されます。 Python は、指定された時間間隔における値の平均化、合計、最大化など、さまざまなダウンサンプリング手法を提供します。
###構文### リーリー
ここでは、平均、合計、最大
などの集計方法がリサンプリング後に適用され、各リサンプリング間隔内のグループ化された観測値を表す単一の値が計算されます。これらの方法は通常、データをダウンサンプリングするときに使用されます。これらは、リサンプリングされた DataFrame に直接適用することも、リサンプリング関数と組み合わせて使用して、適切なルールを指定して特定の頻度 (週次、月次など) に基づいてデータを集計することもできます。平均ダウンサンプリング
の中国語訳は次のとおりです:
平均ダウンサンプリング平均ダウンサンプリングでは、各間隔内のデータ ポイントの平均が計算されます。この方法は、高頻度のデータを処理して区間ごとの代表値を求める場合に便利です。リサンプル関数を平均法と組み合わせて使用すると、平均ダウンサンプリングを実行できます。
Example
的中文翻译为:示例
In the below example, we start with a daily time series DataFrame spanning the entire month of June 2023. The resample function with the 'W' frequency downsamples the data to weekly intervals. By applying the mean method, we obtain the average value within each week. The resulting DataFrame, df_downsampled, contains the mean-downsampled time series data.
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|
输出
1 2 3 4 5 6 7 |
|
Maximum Downsampling
最大降采样计算并设置每个间隔内的最高值。此方法适用于识别时间序列中的峰值或极端事件。在前面的示例中使用max而不是mean或sum允许我们执行最大降采样。
Example
的中文翻译为:示例
In the below example, we start with a daily time series DataFrame spanning the entire month of June 2023. The resample function with the 'W' frequency downsamples the data to weekly intervals. By applying the max method, we obtain the Maximum value within each week. The resulting DataFrame, df_downsampled, contains the maximum-downsampled time series data.
1 2 3 4 5 6 7 8 9 10 11 12 |
|
输出
1 2 3 4 5 6 7 |
|
结论
在本文中,我们讨论了如何使用Python对时间序列数据进行重新采样。Python提供了各种上采样和下采样技术。我们探讨了线性和最近邻插值用于上采样,以及均值和最大值插值用于下采样。您可以根据手头的问题使用任何一种上采样或下采样技术。
以上がPython で時系列データをリサンプリングする方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











PHPは主に手順プログラミングですが、オブジェクト指向プログラミング(OOP)もサポートしています。 Pythonは、OOP、機能、手続き上のプログラミングなど、さまざまなパラダイムをサポートしています。 PHPはWeb開発に適しており、Pythonはデータ分析や機械学習などのさまざまなアプリケーションに適しています。

PHPはWeb開発と迅速なプロトタイピングに適しており、Pythonはデータサイエンスと機械学習に適しています。 1.PHPは、単純な構文と迅速な開発に適した動的なWeb開発に使用されます。 2。Pythonには簡潔な構文があり、複数のフィールドに適しており、強力なライブラリエコシステムがあります。

PythonコードをSublimeテキストで実行するには、最初にPythonプラグインをインストールし、次に.pyファイルを作成してコードを書き込み、Ctrl Bを押してコードを実行する必要があります。コードを実行すると、出力がコンソールに表示されます。

PHPは1994年に発信され、Rasmuslerdorfによって開発されました。もともとはウェブサイトの訪問者を追跡するために使用され、サーバー側のスクリプト言語に徐々に進化し、Web開発で広く使用されていました。 Pythonは、1980年代後半にGuidovan Rossumによって開発され、1991年に最初にリリースされました。コードの読みやすさとシンプルさを強調し、科学的コンピューティング、データ分析、その他の分野に適しています。

Pythonは、スムーズな学習曲線と簡潔な構文を備えた初心者により適しています。 JavaScriptは、急な学習曲線と柔軟な構文を備えたフロントエンド開発に適しています。 1。Python構文は直感的で、データサイエンスやバックエンド開発に適しています。 2。JavaScriptは柔軟で、フロントエンドおよびサーバー側のプログラミングで広く使用されています。

Golangは、パフォーマンスとスケーラビリティの点でPythonよりも優れています。 1)Golangのコンピレーションタイプの特性と効率的な並行性モデルにより、高い並行性シナリオでうまく機能します。 2)Pythonは解釈された言語として、ゆっくりと実行されますが、Cythonなどのツールを介してパフォーマンスを最適化できます。

Visual Studioコード(VSCODE)でコードを作成するのはシンプルで使いやすいです。 VSCODEをインストールし、プロジェクトの作成、言語の選択、ファイルの作成、コードの書き込み、保存して実行します。 VSCODEの利点には、クロスプラットフォーム、フリーおよびオープンソース、強力な機能、リッチエクステンション、軽量で高速が含まれます。

メモ帳でPythonコードを実行するには、Python実行可能ファイルとNPPEXECプラグインをインストールする必要があります。 Pythonをインストールしてパスを追加した後、nppexecプラグインでコマンド「python」とパラメーター "{current_directory} {file_name}"を構成して、メモ帳のショートカットキー「F6」を介してPythonコードを実行します。
