Python は Alibaba Cloud インターフェースを呼び出して OCR テキスト抽出機能を実装します-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

Python は Alibaba Cloud インターフェースを呼び出して OCR テキスト抽出機能を実装します

王林

Jul 05, 2023 pm 09:49 PM

python アリ・クラウド ocr

Python は Alibaba Cloud インターフェイスを呼び出して OCR テキスト抽出機能を実装します

Alibaba Cloud は、OCR (光学文字認識) テキスト認識インターフェイスを含む一連の強力な API を提供します。このインターフェイスを通じて、画像内のテキストを識別できます。これは、紙文書内のテキストを電子テキストに変換するなど、一部のテキスト抽出シナリオに非常に適しています。

この記事では、Python で Alibaba Cloud の OCR インターフェイスを呼び出し、テキスト抽出機能を実装する方法を紹介します。具体的な手順は次のとおりです。

ステップ 1: Alibaba Cloud SDK のインストール

Alibaba Cloud の API インターフェイスを呼び出すには、まず対応する SDK をインストールする必要があります。 Python では、pip コマンドを通じて Alibaba Cloud SDK をインストールできます。

ターミナルを開いて次のコマンドを入力します:

pip install aliyun-python-sdk-core
pip install aliyun-python-sdk-ocr

ログイン後にコピー

ステップ 2: アクセスキーと秘密キーを取得する

Alibaba Cloud の API を呼び出すには、アクセスキーと秘密キーを指定する必要があります。秘密鍵。これら 2 つの重要な情報は、Alibaba Cloud コンソールで申請して取得できます。これらの情報は両方とも安全な場所に保管してください。

ステップ 3: OCR インターフェイスを呼び出すコードを作成する

まず、関連するライブラリをインポートする必要があります:

import base64
import json
import urllib
import urllib.request
from aliyunsdkcore import client
from aliyunsdkocr.request.v20191230 import RecognizeCharacterRequest

ログイン後にコピー

次に、Alibaba Cloud クライアントを初期化します:

def create_aliyun_client():
    access_key = "<Your Access Key>"
    secret_key = "<Your Secret Key>"
    region_id = "cn-hangzhou"
    return client.AcsClient(access_key, secret_key, region_id)

ログイン後にコピー

次に、OCR インターフェイスを呼び出す関数を作成します。

def ocr_character(image_path):
    app_key = "<Your App Key>"
    request = RecognizeCharacterRequest.RecognizeCharacterRequest()
    request.set_accept_format('json')
    with open(image_path, 'rb') as file:
        image_data = file.read()
        base64_data = base64.b64encode(image_data)
        request.set_ImageURL(base64_data)
    response = create_aliyun_client().do_action_with_exception(request)
    result = json.loads(response)
    print(result)

ログイン後にコピー

上記のコードでは、アクセスキー、シークレットキー、アプリキーを置き換えて、必要な画像のパスを渡す必要があります。特定する。

最後に、ocr_character 関数を呼び出し、認識する必要がある画像のパスを渡します。

if __name__ == "__main__":
    image_path = "<Your Image Path>"
    ocr_character(image_path)

ログイン後にコピー

ここでは画像のローカルパスが使用されていることに注意してください。ネットワーク上の画像を識別したい場合は、その URL を使用する必要があります。また、Alibaba Cloud の OCR インターフェイスは現在サポートされている画像形式が限られており、一般的には JPEG または PNG 形式の画像を使用することをお勧めします。

概要:

この記事では、Python を使用して Alibaba Cloud の OCR インターフェイスを呼び出し、テキスト抽出機能を実装する方法を紹介します。このインターフェースを介して、画像内のテキストを電子テキストに簡単に変換できるため、作業効率が向上し、手動での文字起こし作業の一部が簡素化されます。

この記事がお役に立てば幸いです!

以上がPython は Alibaba Cloud インターフェースを呼び出して OCR テキスト抽出機能を実装しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Java チュートリアル

1669

CakePHP チュートリアル

1428

Laravel チュートリアル

1329

PHP チュートリアル

1273

C# チュートリアル

1256

Related knowledge

PHPおよびPython：さまざまなパラダイムが説明されています Apr 18, 2025 am 12:26 AM

PHPは主に手順プログラミングですが、オブジェクト指向プログラミング（OOP）もサポートしています。 Pythonは、OOP、機能、手続き上のプログラミングなど、さまざまなパラダイムをサポートしています。 PHPはWeb開発に適しており、Pythonはデータ分析や機械学習などのさまざまなアプリケーションに適しています。

PHPとPythonの選択：ガイド Apr 18, 2025 am 12:24 AM

PHPはWeb開発と迅速なプロトタイピングに適しており、Pythonはデータサイエンスと機械学習に適しています。 1.PHPは、単純な構文と迅速な開発に適した動的なWeb開発に使用されます。 2。Pythonには簡潔な構文があり、複数のフィールドに適しており、強力なライブラリエコシステムがあります。

Sublime Code Pythonを実行する方法 Apr 16, 2025 am 08:48 AM

PythonコードをSublimeテキストで実行するには、最初にPythonプラグインをインストールし、次に.pyファイルを作成してコードを書き込み、Ctrl Bを押してコードを実行する必要があります。コードを実行すると、出力がコンソールに表示されます。

PHPとPython：彼らの歴史を深く掘り下げます Apr 18, 2025 am 12:25 AM

PHPは1994年に発信され、Rasmuslerdorfによって開発されました。もともとはウェブサイトの訪問者を追跡するために使用され、サーバー側のスクリプト言語に徐々に進化し、Web開発で広く使用されていました。 Pythonは、1980年代後半にGuidovan Rossumによって開発され、1991年に最初にリリースされました。コードの読みやすさとシンプルさを強調し、科学的コンピューティング、データ分析、その他の分野に適しています。

Python vs. JavaScript：学習曲線と使いやすさ Apr 16, 2025 am 12:12 AM

Pythonは、スムーズな学習曲線と簡潔な構文を備えた初心者により適しています。 JavaScriptは、急な学習曲線と柔軟な構文を備えたフロントエンド開発に適しています。 1。Python構文は直感的で、データサイエンスやバックエンド開発に適しています。 2。JavaScriptは柔軟で、フロントエンドおよびサーバー側のプログラミングで広く使用されています。

Golang vs. Python：パフォーマンスとスケーラビリティ Apr 19, 2025 am 12:18 AM

Golangは、パフォーマンスとスケーラビリティの点でPythonよりも優れています。 1）Golangのコンピレーションタイプの特性と効率的な並行性モデルにより、高い並行性シナリオでうまく機能します。 2）Pythonは解釈された言語として、ゆっくりと実行されますが、Cythonなどのツールを介してパフォーマンスを最適化できます。

vscodeでコードを書く場所 Apr 15, 2025 pm 09:54 PM

Visual Studioコード（VSCODE）でコードを作成するのはシンプルで使いやすいです。 VSCODEをインストールし、プロジェクトの作成、言語の選択、ファイルの作成、コードの書き込み、保存して実行します。 VSCODEの利点には、クロスプラットフォーム、フリーおよびオープンソース、強力な機能、リッチエクステンション、軽量で高速が含まれます。

メモ帳でPythonを実行する方法 Apr 16, 2025 pm 07:33 PM

メモ帳でPythonコードを実行するには、Python実行可能ファイルとNPPEXECプラグインをインストールする必要があります。 Pythonをインストールしてパスを追加した後、nppexecプラグインでコマンド「python」とパラメーター "{current_directory} {file_name}"を構成して、メモ帳のショートカットキー「F6」を介してPythonコードを実行します。

See all articles

Python は Alibaba Cloud インターフェースを呼び出して OCR テキスト抽出機能を実装します

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック