Jadual Kandungan
Rangkaian Neural Berulang (RNNS): Panduan Komprehensif
Bagaimana fungsi RNN
Jenis RNNs
Kursus pembelajaran mesin yang disyorkan
CNNS vs RNNS
Batasan RNN
Arkitek RNN ​​Lanjutan
Ramalan Harga Saham MasterCard Menggunakan LSTM & Gru
Kesimpulan
Rumah Peranti teknologi AI Tutorial Rangkaian Neural Berulang (RNN)

Tutorial Rangkaian Neural Berulang (RNN)

Mar 11, 2025 am 09:52 AM

Rangkaian Neural Berulang (RNNS): Panduan Komprehensif

Rangkaian Neural Berulang (RNNs) adalah jenis rangkaian saraf buatan (ANN) yang kuat yang digunakan dalam aplikasi seperti Siri Apple dan carian suara Google. Keupayaan unik mereka untuk mengekalkan input masa lalu melalui memori dalaman menjadikannya sesuai untuk tugas -tugas seperti ramalan harga saham, penjanaan teks, transkripsi, dan terjemahan mesin. Tidak seperti rangkaian saraf tradisional di mana input dan output adalah bebas, output RNN bergantung kepada unsur -unsur sebelumnya dalam urutan. Selain itu, parameter saham RNNS merentasi lapisan rangkaian, mengoptimumkan berat badan dan pelarasan bias semasa keturunan kecerunan.

Tutorial Rangkaian Neural Berulang (RNN)

Rajah di atas menggambarkan RNN asas. Dalam senario ramalan harga saham menggunakan data seperti [45, 56, 45, 49, 50, ...], setiap input (x0 hingga XT) menggabungkan nilai masa lalu. Sebagai contoh, x0 akan menjadi 45, x1 akan menjadi 56, dan nilai -nilai ini menyumbang kepada meramalkan elemen urutan seterusnya.

Bagaimana fungsi RNN

Dalam RNN, kitaran maklumat melalui gelung, menjadikan output fungsi kedua -dua input semasa dan sebelumnya.

Tutorial Rangkaian Neural Berulang (RNN)

Lapisan input (x) memproses input awal, lulus ke lapisan tengah (a), yang terdiri daripada pelbagai lapisan tersembunyi dengan fungsi pengaktifan, berat, dan bias. Parameter ini dikongsi di lapisan tersembunyi, mewujudkan satu lapisan gelung tunggal dan bukannya pelbagai lapisan yang berbeza. RNNs menggunakan backpropagation melalui masa (BPTT) dan bukannya backpropagation tradisional untuk mengira kecerunan. Kesalahan BPTT pada setiap langkah kerana parameter bersama.

Jenis RNNs

RNN menawarkan fleksibiliti dalam panjang input dan output, tidak seperti rangkaian feedforward dengan input dan output tunggal. Kesesuaian ini membolehkan RNNs mengendalikan pelbagai tugas, termasuk penjanaan muzik, analisis sentimen, dan terjemahan mesin. Empat jenis utama wujud:

  • Satu-ke-satu: Rangkaian saraf mudah yang sesuai untuk masalah input/output tunggal.
  • One-to-Many: memproses input tunggal untuk menghasilkan pelbagai output (misalnya, imej imej).
  • Ramai-ke-satu: Mengambil beberapa input untuk meramalkan satu output (contohnya, klasifikasi sentimen).
  • Ramai-ke-banyak: Mengendalikan pelbagai input dan output (contohnya, terjemahan mesin).

Tutorial Rangkaian Neural Berulang (RNN)

Kursus pembelajaran mesin yang disyorkan

Ketahui lebih lanjut mengenai RNNS untuk pemodelan bahasa

Terokai Pengenalan Pembelajaran Deep di Python

CNNS vs RNNS

Rangkaian Neural Convolutional (CNNS) adalah pemprosesan data spatial rangkaian feedforward (seperti imej), yang biasa digunakan dalam penglihatan komputer. Rangkaian saraf mudah berjuang dengan dependensi piksel imej, manakala CNN, dengan lapisan convolutional, relu, pengumpulan, dan sepenuhnya bersambung, cemerlang di kawasan ini.

Tutorial Rangkaian Neural Berulang (RNN)

Perbezaan utama:

  • CNNs mengendalikan data jarang (imej), manakala RNN menguruskan siri masa dan data berurutan.
  • CNNS menggunakan backpropagation standard, RNNs menggunakan BPTT.
  • CNN mempunyai input/output terhingga; RNN adalah fleksibel.
  • CNNs adalah feedforward; RNNs menggunakan gelung untuk data berurutan.
  • CNN digunakan untuk pemprosesan imej/video; RNNS untuk analisis pertuturan/teks.

Batasan RNN

RNN mudah menghadapi dua cabaran utama yang berkaitan dengan kecerunan:

  1. Kecerunan Vanishing: Kecerunan menjadi terlalu kecil, menghalang kemas kini parameter dan pembelajaran.
  2. Kecerunan meletup: Kecerunan menjadi terlalu besar, menyebabkan ketidakstabilan model dan masa latihan yang lebih lama.

Penyelesaian termasuk mengurangkan lapisan tersembunyi atau menggunakan seni bina canggih seperti LSTM dan GRU.

Arkitek RNN ​​Lanjutan

RNN mudah mengalami batasan memori jangka pendek. LSTM dan GRU alamat ini dengan membolehkan pengekalan maklumat dalam tempoh yang panjang.

Tutorial Rangkaian Neural Berulang (RNN)

  • Memori jangka pendek yang panjang (LSTM): RNN maju yang direka untuk mengurangkan kecerunan lenyap/meletup. Empat lapisan berinteraksi memudahkan pengekalan ingatan jangka panjang, menjadikannya sesuai untuk terjemahan mesin, sintesis pertuturan, dan banyak lagi.

Tutorial Rangkaian Neural Berulang (RNN)

  • Unit berulang Gated (GRU): Variasi LSTM yang lebih mudah, menggunakan pintu kemas kini dan tetapkan semula untuk menguruskan aliran maklumat. Senibina yang diselaraskannya sering membawa kepada latihan yang lebih cepat berbanding LSTM.

Tutorial Rangkaian Neural Berulang (RNN)

Ramalan Harga Saham MasterCard Menggunakan LSTM & Gru

Bahagian ini memperincikan projek menggunakan LSTM dan GRU untuk meramalkan harga saham MasterCard. Kod ini menggunakan perpustakaan seperti pandas, numpy, matplotlib, scikit-learn, dan tensorflow.

(Contoh kod terperinci dari input asal ditinggalkan di sini untuk keringkasan. Langkah -langkah teras diringkaskan di bawah.)

  1. Analisis data: Import dan bersihkan dataset saham MasterCard.
  2. Data Preprocessing: Pecahkan data ke dalam set latihan dan ujian, skala menggunakan MinMaxScaler , dan Reshape untuk input model.
  3. Model LSTM: Membina dan melatih model LSTM.
  4. Hasil LSTM: Menilai prestasi model LSTM menggunakan RMSE.
  5. Model Gru: Membina dan melatih model GRU dengan seni bina yang serupa.
  6. Hasil GRU: Menilai prestasi model GRU menggunakan RMSE.
  7. Kesimpulan: Bandingkan prestasi model LSTM dan GRU.

Tutorial Rangkaian Neural Berulang (RNN)

Tutorial Rangkaian Neural Berulang (RNN)

Kesimpulan

Rangkaian CNN-RNN hibrid semakin digunakan untuk tugas yang memerlukan pemahaman spatial dan temporal. Tutorial ini memberikan pemahaman asas tentang RNN, batasan mereka, dan penyelesaian yang ditawarkan oleh seni bina canggih seperti LSTM dan GRU. Projek ini menunjukkan permohonan LSTM dan GRU untuk ramalan harga saham, menonjolkan prestasi unggul Gru dalam kes tertentu ini. Projek lengkap boleh didapati di ruang kerja DataCamp.

https://www.php.cn/link/8708107b2ff5de15d0244471ae041fdb ingat untuk menggantikan https://www.php.cn/link/cc6a6632b380f3f6a1c54b1222cd96c2 URL imej diandaikan betul dan boleh diakses.

Atas ialah kandungan terperinci Tutorial Rangkaian Neural Berulang (RNN). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1659
14
Tutorial PHP
1257
29
Tutorial C#
1232
24
Bermula dengan Meta Llama 3.2 - Analytics Vidhya Bermula dengan Meta Llama 3.2 - Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta's Llama 3.2: Lompat ke hadapan dalam Multimodal dan Mobile AI META baru -baru ini melancarkan Llama 3.2, kemajuan yang ketara dalam AI yang memaparkan keupayaan penglihatan yang kuat dan model teks ringan yang dioptimumkan untuk peranti mudah alih. Membina kejayaan o

10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari 10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari Apr 13, 2025 am 01:14 AM

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let &#8217

AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagi AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagi Apr 11, 2025 pm 12:01 PM

Landskap AI minggu ini: Badai kemajuan, pertimbangan etika, dan perdebatan pengawalseliaan. Pemain utama seperti Openai, Google, Meta, dan Microsoft telah melepaskan kemas kini, dari model baru yang terobosan ke peralihan penting di LE

Menjual Strategi AI kepada Pekerja: Manifesto CEO Shopify Menjual Strategi AI kepada Pekerja: Manifesto CEO Shopify Apr 10, 2025 am 11:19 AM

Memo CEO Shopify Tobi Lütke baru -baru ini dengan berani mengisytiharkan penguasaan AI sebagai harapan asas bagi setiap pekerja, menandakan peralihan budaya yang signifikan dalam syarikat. Ini bukan trend seketika; Ini adalah paradigma operasi baru yang disatukan ke p

Panduan Komprehensif untuk Model Bahasa Visi (VLMS) Panduan Komprehensif untuk Model Bahasa Visi (VLMS) Apr 12, 2025 am 11:58 AM

Pengenalan Bayangkan berjalan melalui galeri seni, dikelilingi oleh lukisan dan patung yang terang. Sekarang, bagaimana jika anda boleh bertanya setiap soalan dan mendapatkan jawapan yang bermakna? Anda mungkin bertanya, "Kisah apa yang anda ceritakan?

GPT-4O vs OpenAI O1: Adakah model Openai baru bernilai gembar-gembur? GPT-4O vs OpenAI O1: Adakah model Openai baru bernilai gembar-gembur? Apr 13, 2025 am 10:18 AM

Pengenalan OpenAI telah mengeluarkan model barunya berdasarkan seni bina "strawberi" yang sangat dijangka. Model inovatif ini, yang dikenali sebagai O1, meningkatkan keupayaan penalaran, yang membolehkannya berfikir melalui masalah MOR

Bagaimana untuk menambah lajur dalam SQL? - Analytics Vidhya Bagaimana untuk menambah lajur dalam SQL? - Analytics Vidhya Apr 17, 2025 am 11:43 AM

Pernyataan Jadual Alter SQL: Menambah lajur secara dinamik ke pangkalan data anda Dalam pengurusan data, kebolehsuaian SQL adalah penting. Perlu menyesuaikan struktur pangkalan data anda dengan cepat? Pernyataan Jadual ALTER adalah penyelesaian anda. Butiran panduan ini menambah colu

Penyusunan Tahunan Terkini Teknik Kejuruteraan Terbaik Penyusunan Tahunan Terkini Teknik Kejuruteraan Terbaik Apr 10, 2025 am 11:22 AM

Bagi anda yang mungkin baru dalam lajur saya, saya secara meluas meneroka kemajuan terkini di AI di seluruh papan, termasuk topik seperti yang terkandung AI, penaakulan AI, terobosan berteknologi tinggi di AI, kejuruteraan segera, latihan AI, Fielding of AI, AI Re Re,

See all articles