目次
クラスのコーディング
});
$ crawler-> filter( 'img') - >それぞれ(function(crawler $ node){
SymfonyのDomcrawlerコンポーネントを使用してAjaxロードのコンテンツをスクレイプできますか?
ホームページ バックエンド開発 PHPチュートリアル Symfony' s Domcrawlerでの画像削り

Symfony' s Domcrawlerでの画像削り

Feb 21, 2025 am 08:47 AM

Symfony' s Domcrawlerでの画像削り

私の写真家の友人は、インターネットから額縁の画像を見つけてダウンロードするように私を懇願しました。私は最終的に、それらの多くが無料で利用できるWebページに着地しましたが、問題がありました。すべての画像を一緒にダウンロードするためのリンクは存在しませんでした。

画像を個別にダウンロードするストレスを経験したくなかったので、このPHPクラスを書き、Webサイトで見つかったすべての画像を見つけ、ダウンロードし、zipしました。

キーテイクアウト

    PHPクラスでは、SymfonyのDomcrawlerコンポーネントを使用して、Webページから画像をスクレイプし、フォルダーにダウンロードして保存し、フォルダーのzipアーカイブを作成し、フォルダーを削除します。このクラスは、Webサイトから複数の画像をダウンロードするプロセスを自動化するように設計されています。
  • クラスには、5つの私有地と8つのパブリックメソッドが含まれています。プロパティは、フォルダー名、WebページURL、HTMLドキュメントコード、ZIPファイル名、操作ステータスなどの情報を保存します。メソッドには、フォルダーとファイル名を設定し、domcrawlerをインスタンス化し、画像をダウンロードして保存し、zipファイルを作成し、フォルダーを削除し、操作ステータスを取得する機能が含まれます。
  • クラスを使用するには、すべての必要なファイルをAutoloadまたは明示的に含める必要があります。 SetFolderおよびSetFileNameメソッドは、それぞれの引数を使用して呼び出され、プロセスメソッドが呼び出され、クラスを機能させる必要があります。 domcrawlerコンポーネントとcreate_zip関数を含める必要があります。
  • クラスの仕組み
  • 画像のURLを検索し、画像をフォルダーにダウンロードして保存し、フォルダーのzipアーカイブを作成し、最後にフォルダーを削除します。
クラスは、SymfonyのDomCrawlerコンポーネントを使用して、Webページにあるすべての画像リンクとZIPファイルを作成するカスタムZIP関数を検索します。 ZIP機能についてDavid Walshにクレジットします

クラスのコーディング

クラスは、5つの私有地と__ Construct Magicメソッドを含む8つのパブリックメソッドで構成されています。

以下は、クラスのプロパティとその役割のリストです。

1。$フォルダー:削られた画像を含むフォルダーの名前を保存します。

2。$ URL:WebページURLを保存します。

3。$ HTML:WebページのHTMLドキュメントコードを削減するために保存します。

4。$ filename:zipファイルの名前を保存します。 Symfony' s Domcrawlerでの画像削り 5。$ステータス:操作のステータスを保存します。つまり、それが成功または失敗であった場合。

クラスの構築を始めましょう。

上記の5つのプロパティを含むクラスのzipimagesを作成します。


URLを引数として受け入れる__construct Magicメソッドを作成します。

この方法は非常に自明です。

作成されたZIPアーカイブには、削り取られた画像を含むフォルダーがあります。以下のSetFolderメソッドはこれを構成します

デフォルトでは、フォルダー名は画像に設定されていますが、メソッドは、フォルダー名を引数として単に渡すだけで、フォルダーの名前を変更するオプションを提供します。

<span><span><?php
</span></span><span><span>class ZipImages {
</span></span><span>    <span>private $folder;
</span></span><span>    <span>private $url;
</span></span><span>    <span>private $html;
</span></span><span>    <span>private $fileName;
</span></span><span>    <span>private $status;</span></span>
ログイン後にコピー

setFileNameは、zipimagesに設定されたデフォルトの名前を使用してzipファイルの名前を変更するオプションを提供します。

この時点で、Symfony Crawlerコンポーネントをインスタンス化して画像を検索し、すべての画像をフォルダーにダウンロードして保存します。
<span>public function __construct($url) {
</span>    <span>$this->url = $url; 
</span>    <span>$this->html = file_get_contents($this->url);
</span>    <span>$this->setFolder();
</span><span>}</span>
ログイン後にコピー

ダウンロードが完了したら、カスタムcreate_zip関数を使用して画像フォルダーをzipアーカイブに圧縮します。

<span>public function setFolder($folder="image") {
</span>    <span>// if folder doesn't exist, attempt to create one and store the folder name in property $folder
</span>    <span>if(!file_exists($folder)) {
</span>        <span>mkdir($folder);
</span>    <span>}
</span>    <span>$this->folder = $folder;
</span><span>}</span>
ログイン後にコピー

最後に、ZIPファイルが作成された後に作成されたフォルダーを削除します。

<span>public function setFileName($name = "zipImages") {
</span>    <span>$this->fileName = $name;
</span><span>}</span>
ログイン後にコピー
操作のステータスを取得します。つまり、成功した場合、またはエラーが発生した場合

上記のすべてのメソッドを処理します。
<span>public function domCrawler() {
</span>    <span>//instantiate the symfony DomCrawler Component
</span>    <span>$crawler = new Crawler($this->html);
</span>    <span>// create an array of all scrapped image links
</span>    <span>$result = $crawler
</span>        <span>->filterXpath('//img')
</span>        <span>->extract(array('src'));
</span>
<span>// download and save the image to the folder 
</span>    <span>foreach ($result as $image) {
</span>        <span>$path = $this->folder."/".basename($image);
</span>        <span>$file = file_get_contents($image);
</span>        <span>$insert = file_put_contents($path, $file);
</span>        <span>if (!$insert) {
</span>            <span>throw new <span>\Exception</span>('Failed to write image');
</span>        <span>}
</span>    <span>}
</span><span>}</span>
ログイン後にコピー

githubから完全なクラスをダウンロードできます。
<span>public function createZip() {
</span>    <span>$folderFiles = scandir($this->folder);
</span>    <span>if (!$folderFiles) {
</span>        <span>throw new <span>\Exception</span>('Failed to scan folder');
</span>    <span>}
</span>    <span>$fileArray = array();
</span>    <span>foreach($folderFiles as $file){
</span>        <span>if (($file != ".") && ($file != "..")) {
</span>            <span>$fileArray[] = $this->folder."/".$file;
</span>        <span>}
</span>    <span>}
</span>
    <span>if (create_zip($fileArray, $this->fileName.'.zip')) {
</span>        <span>$this->status = <span><span><<<HTML</span>
</span></span><span>File successfully archived. <a href="<span><span>$this->fileName</span>.zip">Download it now</a>
</span></span><span><span>HTML<span>;</span></span>
</span>    <span>} else {
</span>        <span>$this->status = "An error occurred";
</span>    <span>}
</span><span>}</span>
ログイン後にコピー

クラス依存関係

クラスが機能するには、domcrawlerコンポーネントとcreate_zip関数を含める必要があります。この関数のコードをこちらからダウンロードできます。
<span>public function deleteCreatedFolder() {
</span>    <span>$dp = opendir($this->folder) or die ('ERROR: Cannot open directory');
</span>    <span>while ($file = readdir($dp)) {
</span>        <span>if ($file != '.' && $file != '..') {
</span>            <span>if (is_file("<span><span>$this->folder</span>/<span>$file</span>"</span>)) {
</span>                <span>unlink("<span><span>$this->folder</span>/<span>$file</span>"</span>);
</span>            <span>}
</span>        <span>}
</span>    <span>}
</span>    <span>rmdir($this->folder) or die ('could not delete folder');
</span><span>}</span>
ログイン後にコピー

次の要求ステートメントをComposer.jsonに追加するだけで、Composerを介してDomcrawlerコンポーネントをダウンロードしてインストールします。

$ php composer.pharインストールを実行してライブラリをダウンロードし、ベンダー/autoload.php autoloaderファイルを生成します。 クラスを使用して

SetFolderを呼び出し、SetFileNameメソッドを呼び出して、それぞれの引数を渡します。フォルダー名を変更する必要がある場合にのみ、SetFolderメソッドを呼び出します。 クラスを機能させるためにプロセスメソッドを呼び出してください。
<span>public function getStatus() {
</span>    <span>echo $this->status;
</span><span>}</span>
ログイン後にコピー

  • 要約
  • この記事では、ダウンロードした画像をZIPアーカイブに自動的に圧縮するシンプルなPHP画像スクレーパーを作成する方法を学びました。改善のための代替ソリューションまたは提案がある場合は、以下のコメントに残してください。すべてのフィードバックは大歓迎です!
  • SymfonyのDomcrawlerでの画像のスクレイピングに関するよくある質問(FAQ)
  • SymfonyのDomcrawlerコンポーネントをインストールするにはどうすればよいですか?簡単です。 PHPの依存関係管理ツールであるComposerを使用できます。プロジェクトディレクトリで次のコマンドを実行します。ComposerはSymfony/Dom-Crawlerを必要とします。これにより、domcrawlerコンポーネントが依存関係とともにダウンロードしてインストールされます。$ crawler = new crawler($ html);

    $ crawler-> filter( 'img') - >それぞれ(function(crawler $ node){
    echo $ node-> attr( 'src');
    });

    symfonyのdomcrawlerコンポーネントを使用できますかlaravel?

    はい、Laravelを使用したSymfonyのDomcrawlerコンポーネントを使用できます。 LaravelのHTTPテスト機能は、実際にはフードの下にDomcrawlerコンポーネントを使用しています。これは、同じ方法とテクニックを使用して、LaravelテストでHTMLコンテンツを横断および操作できることを意味します。

    SymfonyのDomcrawlerコンポーネントを使用して要素を選択するにはどうすればよいですか?フィルター、FilterXPath、SelectLinkなどの要素を選択します。これらの方法では、それぞれタグ名、Xpath式、またはリンクテキストに基づいて要素を選択できます。

    SymfonyのDomcrawlerコンポーネントを使用して要素のコンテンツを変更できますか? SymfonyのDomcrawlerコンポーネントを使用して、要素の内容を変更します。各メソッドにより、選択した各要素を反復し、その操作を実行できます。たとえば、次のような画像要素のSRC属性を変更できます。 attr( 'src'、 'new-image.jpg');

    });

    symfonyを使用するときにエラーと例外を処理するにはどうすればよいですかdomcrawlerコンポーネント?

    $ crawler-> filter( 'img') - >それぞれ(function(crawler $ node){

    echo $ node-> attr( 'src');

    });

    SymfonyのDomcrawlerコンポーネントを使用してAjaxロードのコンテンツをスクレイプできますか?

    残念ながら、SymfonyのDomcrawlerコンポーネントは、JavaScriptを実行しないため、Ajaxにロードされたコンテンツを直接スクレイすることはできません。ただし、GuzzleやGoutteなどのツールをDomcrawlerコンポーネントと組み合わせて使用​​して、HTTPリクエストを送信し、Ajax-Loadedコンテンツを処理できます。

以上がSymfony&#x27; s Domcrawlerでの画像削りの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 Apr 05, 2025 am 12:04 AM

JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。

セッションのハイジャックはどのように機能し、どのようにPHPでそれを軽減できますか? セッションのハイジャックはどのように機能し、どのようにPHPでそれを軽減できますか? Apr 06, 2025 am 12:02 AM

セッションハイジャックは、次の手順で達成できます。1。セッションIDを取得します。2。セッションIDを使用します。3。セッションをアクティブに保ちます。 PHPでのセッションハイジャックを防ぐための方法には次のものが含まれます。1。セッション_regenerate_id()関数を使用して、セッションIDを再生します。2。データベースを介してストアセッションデータを3。

REST APIデザインの原則とは何ですか? REST APIデザインの原則とは何ですか? Apr 04, 2025 am 12:01 AM

Restapiの設計原則には、リソース定義、URI設計、HTTPメソッドの使用、ステータスコードの使用、バージョンコントロール、およびHATEOASが含まれます。 1。リソースは名詞で表され、階層で維持される必要があります。 2。HTTPメソッドは、GETを使用してリソースを取得するなど、セマンティクスに準拠する必要があります。 3.ステータスコードは、404など、リソースが存在しないことを意味します。 4。バージョン制御は、URIまたはヘッダーを介して実装できます。 5。それに応じてリンクを介してhateoasブーツクライアント操作をブーツします。

PHPで例外を効果的に処理する方法(試して、キャッチ、最後に、スロー)? PHPで例外を効果的に処理する方法(試して、キャッチ、最後に、スロー)? Apr 05, 2025 am 12:03 AM

PHPでは、Try、Catch、最後にキーワードをスローすることにより、例外処理が達成されます。 1)TRYブロックは、例外をスローする可能性のあるコードを囲みます。 2)キャッチブロックは例外を処理します。 3)最後にブロックは、コードが常に実行されることを保証します。 4)スローは、例外を手動でスローするために使用されます。これらのメカニズムは、コードの堅牢性と保守性を向上させるのに役立ちます。

PHPの匿名クラスとは何ですか?また、いつ使用できますか? PHPの匿名クラスとは何ですか?また、いつ使用できますか? Apr 04, 2025 am 12:02 AM

PHPの匿名クラスの主な機能は、1回限りのオブジェクトを作成することです。 1.匿名クラスでは、名前のないクラスをコードで直接定義することができます。これは、一時的な要件に適しています。 2。クラスを継承したり、インターフェイスを実装して柔軟性を高めることができます。 3.使用時にパフォーマンスとコードの読みやすさに注意し、同じ匿名のクラスを繰り返し定義しないようにします。

include、require、include_once、require_onceの違いは何ですか? include、require、include_once、require_onceの違いは何ですか? Apr 05, 2025 am 12:07 AM

PHPでは、include、require、include_once、require_onceの違いは次のとおりです。1)include警告を生成し、実行を継続します。これらの機能の選択は、ファイルの重要性と、重複包含を防ぐために必要かどうかに依存します。合理的な使用は、コードの読みやすさと保守性を向上させることができます。

PHPのさまざまなエラータイプを説明します(通知、警告、致命的なエラー、解析エラー)。 PHPのさまざまなエラータイプを説明します(通知、警告、致命的なエラー、解析エラー)。 Apr 08, 2025 am 12:03 AM

PHPには4つの主要なエラータイプがあります。1。notice:わずかなものは、未定義の変数へのアクセスなど、プログラムを中断しません。 2。警告:通知よりも深刻で、ファイルを含むなど、プログラムを終了しません。 3。ファタラー:最も深刻なのは、機能を呼び出すなど、プログラムを終了します。 4。ParseError:構文エラーは、エンドタグの追加を忘れるなど、プログラムの実行を防ぎます。

PHPとPython:2つの一般的なプログラミング言語を比較します PHPとPython:2つの一般的なプログラミング言語を比較します Apr 14, 2025 am 12:13 AM

PHPとPythonにはそれぞれ独自の利点があり、プロジェクトの要件に従って選択します。 1.PHPは、特にWebサイトの迅速な開発とメンテナンスに適しています。 2。Pythonは、データサイエンス、機械学習、人工知能に適しており、簡潔な構文を備えており、初心者に適しています。

See all articles