AI データ視覚化の未来

Oct 31, 2024 am 03:09 AM

The future of AI data visualization

LLM が登場して以来、最初のユースケース/デモの 1 つはデータ分析でした。現段階では、私たちのほとんどは ChatGPT、Claude、またはその他の AI を使用してチャートを生成していますが、データ視覚化において AI が果たす役割についてはまだ結論が出ていないように感じます。今後もデフォルトでポイント アンド クリック グラフを作成し続けるのでしょうか? AIはチャートを100%生成するのでしょうか?それとも、将来のハイブリッドでは、AI 生成とポイント アンド クリックが混在するのでしょうか?

AI およびデータ視覚化分野の創設者として、私はこのトピックがほぼ不可欠であると考えています。 2022 年以降 (つまり、LLM が本格的に登場した後) に設立された私たちは、チャートをどのように扱うかについて決定を下す必要があります。チャート機能を開発するために何時間も開発作業 (および資金) を投資するのでしょうか、それともそれはなくなり、LLM より前に構築されたすべてのツールの埋没コストとなるのでしょうか?それとも未来はハイブリッドになるのでしょうか?私は最近、Data Formulator という研究プロジェクトに出会いました。このプロジェクトでは、AI と従来のグラフ作成の間の非常に興味深い相互作用を調査しており、この疑問が私に甦りました。

この投稿では、テキストからグラフへ (またはテキストから視覚化) の現在の状況と、将来どこへ向かうのかを見ていきます。

テキストから視覚化の現状

AI に関するすべてのことと同様、この投稿もあまり古くならないでしょう。今後 6 か月以内に何らかの新しい情報やモデルが発表され、このトピックに対する私たちの考え方が完全に変わるでしょう。それにもかかわらず、データ視覚化と AI のさまざまな状態を見てみましょう。

純粋なポイントアンドクリックのグラフ作成

ほとんどの読者はこの内容をよく知っているので、これについてはあまり長く言いません。 Excel、Google スプレッドシート、または 2023 年より前に構築されたその他のデータ ツールを開くと、これの何らかの形式が得られます。クリックして軸にデータを追加する場合もあれば、フィールドをドラッグ アンド ドロップする場合もありますが、概念は同じです。データを適切に構造化し、いくつかのボタンを押してグラフを生成します。

このパラダイムでは、データのクリーニングと変換の大部分はグラフ作成の前に行われます。一般に、平均、中央値、カウント、最小、最大などの集計指標を適用できますが、すべての変換はかなり初歩的なものです。

100% AI で生成されたグラフ

AI が生成したチャート、つまりテキストから視覚化が実際に存在したのは、現代の LLM の出現以来です (調べてみると、それ以前にも実験が行われていましたが、実際的な目的としては、2022 年以降に焦点を当てることができます) LLM)。

OpenAI の ChatGPT は、Python を使用して非インタラクティブなチャートを生成したり、フロントエンド ライブラリを使用して限定されたインタラクティブ チャートを生成したりできます (いくつかの例については、「OpenAI Canvas」を参照)。 OpenAI のすべてと同様、Anthropic にも独自の類似概念があり、アーティファクトがあります。

ここで、AI によって生成されたチャートは、純粋に Python で生成されたチャート/バックエンドで生成されたチャート、またはバックエンドとフロント エンドの混合の 2 つのファミリーに細分できることに注目してください。

ChatGPT と Claude が交互に働きます。 AI をトレーニングしてフロント エンド コードを生成し、そのフロント エンド コードを統合してビジュアライゼーションを作成することは、plotly、matplotlib、seaborn などのライブラリを使用して Python に依存するよりもはるかに手間がかかる可能性があります。一方、フロントエンド ライブラリを使用すると、プロバイダーとユーザーはグラフの外観と操作性をより詳細に制御できます。これが、LLM プロバイダーが AI に棒グラフ、折れ線グラフ、散布図などの基本的なグラフを生成させる理由ですが、サンキー ダイアグラムやウォーターフォール グラフなどのより高度なグラフは Python に頼ることになります。

Fabi.ai についての簡単なサイドバー: 当社はデータ分析プラットフォームであるため、明らかにグラフ作成を提供しており、一部のポイント アンド クリックによるグラフ作成にもかかわらず、ユーザーが作成したグラフの大部分は AI によって生成されています。これまでのところ、AI はグラフの生成に非常に優れていることがわかっており、グラフ作成に純粋な Python を活用することで、ユーザーが思い描くほぼすべてのグラフを生成するように AI をトレーニングすることができました。これまでのところ、ポイント アンド クリック機能やカスタム UI デザインよりも、その精度と柔軟性を選択してきました。
ハイブリッド: ポイント アンド クリック パラダイムでの AI 生成
ここから、AI によるテキストから視覚化への移行がどこへ向かうのかという議論が興味深くなり始めます。今から 3 年後、誰かが分析を行うときに、AI を使用する場合、AI に 100% の制御を任せるか、それとも AI が制限内でのみチャートを編集できる混合環境で使用されるでしょうか。特定のポイント アンド クリック機能。

このイメージをより具体的にするには、Data Formulator を確認してください。これは、AI が特定の編集を行うことができるが、必要に応じてユーザーがポイント アンド クリック機能を引き継いで使用できる、真の混合環境を提供しようとする最近の研究プロジェクトです。

車に例えて質問すると: 将​​来の車にはハンドルがなくなると思いますか、それともドライバーがそこに座って注意を払い、時にはハンドルを握る必要があると思いますか?テスラの自動運転機能が現在どのように動作するかに似ていますか?

第一原則: 私が真実だと信じていること

物事がどこに向かっているのかという問題は、Fabi.ai にとって非常に重要です。これは、私たちが下す特定の決定に大きな影響を与える可能性があるためです。フロントエンドにチャート ライブラリを統合することに投資するか?そもそもポイントアンドクリック機能を気にする必要があるでしょうか? AI データ分析分野をリードする革新的な成長企業として、私たちはパックが現在どこにいるかではなく、どこへ行くのかを考える必要があります。

したがって、この質問に答えるために、第一原理の考え方を使用してみます。

AI はますます改良、高速化、低コスト化を続けています

初めて AI を使用し、速度とコストに関して不満が生じたときから、私は AI が今後も改良され、より速く、より安価になると信じてきました。大まかに言えば、トークンあたりのコストは過去数年間で年間 87% 減少しました。コストが下がっただけでなく、精度と速度も大幅に向上しました。

今後 10 年で、私たちは 80 年代と 90 年代の「スーパーコンピューター」を振り返るのと同じように、2024 年の LLM を振り返ることになるでしょう。今では、どこに行くにもポケットにスーパーコンピューターが入っています。

以上のことは、上記のさまざまなグラフ作成アプローチのいずれかに賛成または反対する議論は、AI がグラフを生成するには遅すぎる、高価すぎる、または不正確すぎるということではあり得ません。言い換えれば、ポイント アンド クリック グラフが何らかの形でまだ存在すると信じるには、ユーザー エクスペリエンスやユース ケースに、その機能に値する何かがあると信じる必要があります。

データ視覚化の難しい部分は、データのラングリングとクリーニングです。

私の経験では、視覚化を伴うあらゆる形式のデータ分析を行う場合、難しい部分はグラフ作成ではありません。難しいのは、データをクリーンアップして、作成しようとしているグラフに適した形式に準備することです。

次のフィールドを持つユーザー イベント データがあるとします:

  • イベントID
  • イベント開始タイムスタンプ
  • イベント終了タイムスタンプ

ここで、レイテンシを測定するために平均イベント継続時間を時間ごとにプロットしたいとします。スプレッドシートや従来のグラフ作成ツールで何らかのグラフ作成を行う前に、次のことを行う必要があります。

  1. 終了時刻から開始時刻を引いた値を計算します (おそらく最初に何らかの書式設定を行う必要があります)
  2. 時間単位でデータをピボットします。これは実際には驚くほど難しいです

しかし、AI にこれを実行するように依頼すると、それらすべてとグラフ作成がわずか 1 ~ 2 秒で行われます。

# Calculate the event duration in hours
df['Event duration (hours)'] = (df['Event end datetime'] - df['Event start datetime']).dt.total_seconds() / 3600

# Extract the start hour from the start datetime
df['Start hour'] = df['Event start datetime'].dt.hour

# Group by start hour and calculate the average duration
average_duration_by_hour = df.groupby('Start hour')['Event duration (hours)'].mean().reset_index()

# Plot using Plotly
fig = px.bar(
    average_duration_by_hour, 
    x='Start hour', 
    y='Event duration (hours)',
    title='Average Event Duration by Hour',
    labels={'Event duration (hours)': 'Average Duration (hours)', 'Start hour': 'Hour of Day'},
    text='Event duration (hours)'
)

# Show the figure
fig.show()
ログイン後にコピー

これは最も単純な例の 1 つです。多くの場合、現実世界のデータはさらに複雑です。

AI によるテキストから視覚化の未来: 100% AI 生成によるポイント アンド クリック

この時点で、あなたはおそらく私がどちらに傾いているかを感じているでしょう。分析に必要なすべてのデータを備えたデータセットをほぼ適切に作成できる限り、AI はすでに、瞬く間にデータセットを操作してグラフ化するという点で非常に優れた仕事をしています。今から 1 年、2 年、3 年後にこれが標準でなくなるとは想像しにくいです。

そうは言っても、Data Formulator のような興味深いハイブリッド アプローチがいくつか登場しています。このタイプのアプローチの場合は、おそらく、私たちが何を望んでいるのかを考え、AI がその仕事を遂行できるように十分に明確に説明するよりも、私たちの手や脳の方が速く動いて、素早く調整を行うことができるということです。これが地域ごとに分かれた積み上げ棒グラフであることを前提として、「過去 12 か月の月ごとの総売上高を表示してください」と尋ねると、マウスを動かすだけの方が簡単になる可能性があります。その場合は、ハイブリッド アプローチが最も興味深いかもしれません。AI に最初の処理を依頼し、その後数回クリックするだけで、必要なものが得られます。

完全な AI アプローチでもハイブリッド アプローチでも、成功の鍵はユーザー エクスペリエンスにあります。特にハイブリッド アプローチの場合、AI と人間のインタラクションは完全に連携して機能し、ユーザーにとって非常に直感的である必要があります。

今後 12 か月でこの分野が発展し、テキストからビジュアル化がどのような方向に向かうのかを見るのが楽しみです。

以上がAI データ視覚化の未来の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

Python vs. C:曲線と使いやすさの学習 Python vs. C:曲線と使いやすさの学習 Apr 19, 2025 am 12:20 AM

Pythonは学習と使用が簡単ですが、Cはより強力ですが複雑です。 1。Python構文は簡潔で初心者に適しています。動的なタイピングと自動メモリ管理により、使いやすくなりますが、ランタイムエラーを引き起こす可能性があります。 2.Cは、高性能アプリケーションに適した低レベルの制御と高度な機能を提供しますが、学習しきい値が高く、手動メモリとタイプの安全管理が必要です。

Pythonと時間:勉強時間を最大限に活用する Pythonと時間:勉強時間を最大限に活用する Apr 14, 2025 am 12:02 AM

限られた時間でPythonの学習効率を最大化するには、PythonのDateTime、時間、およびスケジュールモジュールを使用できます。 1. DateTimeモジュールは、学習時間を記録および計画するために使用されます。 2。時間モジュールは、勉強と休息の時間を設定するのに役立ちます。 3.スケジュールモジュールは、毎週の学習タスクを自動的に配置します。

Python vs. C:パフォーマンスと効率の探索 Python vs. C:パフォーマンスと効率の探索 Apr 18, 2025 am 12:20 AM

Pythonは開発効率でCよりも優れていますが、Cは実行パフォーマンスが高くなっています。 1。Pythonの簡潔な構文とリッチライブラリは、開発効率を向上させます。 2.Cのコンピレーションタイプの特性とハードウェア制御により、実行パフォーマンスが向上します。選択を行うときは、プロジェクトのニーズに基づいて開発速度と実行効率を比較検討する必要があります。

Pythonの学習:2時間の毎日の研究で十分ですか? Pythonの学習:2時間の毎日の研究で十分ですか? Apr 18, 2025 am 12:22 AM

Pythonを1日2時間学ぶだけで十分ですか?それはあなたの目標と学習方法に依存します。 1)明確な学習計画を策定し、2)適切な学習リソースと方法を選択します。3)実践的な実践とレビューとレビューと統合を練習および統合し、統合すると、この期間中にPythonの基本的な知識と高度な機能を徐々に習得できます。

Python vs. C:重要な違​​いを理解します Python vs. C:重要な違​​いを理解します Apr 21, 2025 am 12:18 AM

PythonとCにはそれぞれ独自の利点があり、選択はプロジェクトの要件に基づいている必要があります。 1)Pythonは、簡潔な構文と動的タイピングのため、迅速な開発とデータ処理に適しています。 2)Cは、静的なタイピングと手動メモリ管理により、高性能およびシステムプログラミングに適しています。

Python Standard Libraryの一部はどれですか:リストまたは配列はどれですか? Python Standard Libraryの一部はどれですか:リストまたは配列はどれですか? Apr 27, 2025 am 12:03 AM

PythonListSarePartOfThestAndardarenot.liestareBuilting-in、versatile、forStoringCollectionsのpythonlistarepart。

Python:自動化、スクリプト、およびタスク管理 Python:自動化、スクリプト、およびタスク管理 Apr 16, 2025 am 12:14 AM

Pythonは、自動化、スクリプト、およびタスク管理に優れています。 1)自動化:OSやShutilなどの標準ライブラリを介してファイルバックアップが実現されます。 2)スクリプトの書き込み:Psutilライブラリを使用してシステムリソースを監視します。 3)タスク管理:スケジュールライブラリを使用してタスクをスケジュールします。 Pythonの使いやすさと豊富なライブラリサポートにより、これらの分野で優先ツールになります。

科学コンピューティングのためのPython:詳細な外観 科学コンピューティングのためのPython:詳細な外観 Apr 19, 2025 am 12:15 AM

科学コンピューティングにおけるPythonのアプリケーションには、データ分析、機械学習、数値シミュレーション、視覚化が含まれます。 1.numpyは、効率的な多次元配列と数学的関数を提供します。 2。ScipyはNumpy機能を拡張し、最適化と線形代数ツールを提供します。 3. Pandasは、データ処理と分析に使用されます。 4.matplotlibは、さまざまなグラフと視覚的な結果を生成するために使用されます。

See all articles