Tutorial Rangkaian Neural Berulang (RNN)
Rangkaian Neural Berulang (RNNS): Panduan Komprehensif
Rangkaian Neural Berulang (RNNs) adalah jenis rangkaian saraf buatan (ANN) yang kuat yang digunakan dalam aplikasi seperti Siri Apple dan carian suara Google. Keupayaan unik mereka untuk mengekalkan input masa lalu melalui memori dalaman menjadikannya sesuai untuk tugas -tugas seperti ramalan harga saham, penjanaan teks, transkripsi, dan terjemahan mesin. Tidak seperti rangkaian saraf tradisional di mana input dan output adalah bebas, output RNN bergantung kepada unsur -unsur sebelumnya dalam urutan. Selain itu, parameter saham RNNS merentasi lapisan rangkaian, mengoptimumkan berat badan dan pelarasan bias semasa keturunan kecerunan.
Rajah di atas menggambarkan RNN asas. Dalam senario ramalan harga saham menggunakan data seperti [45, 56, 45, 49, 50, ...], setiap input (x0 hingga XT) menggabungkan nilai masa lalu. Sebagai contoh, x0 akan menjadi 45, x1 akan menjadi 56, dan nilai -nilai ini menyumbang kepada meramalkan elemen urutan seterusnya.
Bagaimana fungsi RNN
Dalam RNN, kitaran maklumat melalui gelung, menjadikan output fungsi kedua -dua input semasa dan sebelumnya.
Lapisan input (x) memproses input awal, lulus ke lapisan tengah (a), yang terdiri daripada pelbagai lapisan tersembunyi dengan fungsi pengaktifan, berat, dan bias. Parameter ini dikongsi di lapisan tersembunyi, mewujudkan satu lapisan gelung tunggal dan bukannya pelbagai lapisan yang berbeza. RNNs menggunakan backpropagation melalui masa (BPTT) dan bukannya backpropagation tradisional untuk mengira kecerunan. Kesalahan BPTT pada setiap langkah kerana parameter bersama.
Jenis RNNs
RNN menawarkan fleksibiliti dalam panjang input dan output, tidak seperti rangkaian feedforward dengan input dan output tunggal. Kesesuaian ini membolehkan RNNs mengendalikan pelbagai tugas, termasuk penjanaan muzik, analisis sentimen, dan terjemahan mesin. Empat jenis utama wujud:
- Satu-ke-satu: Rangkaian saraf mudah yang sesuai untuk masalah input/output tunggal.
- One-to-Many: memproses input tunggal untuk menghasilkan pelbagai output (misalnya, imej imej).
- Ramai-ke-satu: Mengambil beberapa input untuk meramalkan satu output (contohnya, klasifikasi sentimen).
- Ramai-ke-banyak: Mengendalikan pelbagai input dan output (contohnya, terjemahan mesin).
Kursus pembelajaran mesin yang disyorkan
Ketahui lebih lanjut mengenai RNNS untuk pemodelan bahasa
Terokai Pengenalan Pembelajaran Deep di Python
CNNS vs RNNS
Rangkaian Neural Convolutional (CNNS) adalah pemprosesan data spatial rangkaian feedforward (seperti imej), yang biasa digunakan dalam penglihatan komputer. Rangkaian saraf mudah berjuang dengan dependensi piksel imej, manakala CNN, dengan lapisan convolutional, relu, pengumpulan, dan sepenuhnya bersambung, cemerlang di kawasan ini.
Perbezaan utama:
- CNNs mengendalikan data jarang (imej), manakala RNN menguruskan siri masa dan data berurutan.
- CNNS menggunakan backpropagation standard, RNNs menggunakan BPTT.
- CNN mempunyai input/output terhingga; RNN adalah fleksibel.
- CNNs adalah feedforward; RNNs menggunakan gelung untuk data berurutan.
- CNN digunakan untuk pemprosesan imej/video; RNNS untuk analisis pertuturan/teks.
Batasan RNN
RNN mudah menghadapi dua cabaran utama yang berkaitan dengan kecerunan:
- Kecerunan Vanishing: Kecerunan menjadi terlalu kecil, menghalang kemas kini parameter dan pembelajaran.
- Kecerunan meletup: Kecerunan menjadi terlalu besar, menyebabkan ketidakstabilan model dan masa latihan yang lebih lama.
Penyelesaian termasuk mengurangkan lapisan tersembunyi atau menggunakan seni bina canggih seperti LSTM dan GRU.
Arkitek RNN Lanjutan
RNN mudah mengalami batasan memori jangka pendek. LSTM dan GRU alamat ini dengan membolehkan pengekalan maklumat dalam tempoh yang panjang.
- Memori jangka pendek yang panjang (LSTM): RNN maju yang direka untuk mengurangkan kecerunan lenyap/meletup. Empat lapisan berinteraksi memudahkan pengekalan ingatan jangka panjang, menjadikannya sesuai untuk terjemahan mesin, sintesis pertuturan, dan banyak lagi.
- Unit berulang Gated (GRU): Variasi LSTM yang lebih mudah, menggunakan pintu kemas kini dan tetapkan semula untuk menguruskan aliran maklumat. Senibina yang diselaraskannya sering membawa kepada latihan yang lebih cepat berbanding LSTM.
Ramalan Harga Saham MasterCard Menggunakan LSTM & Gru
Bahagian ini memperincikan projek menggunakan LSTM dan GRU untuk meramalkan harga saham MasterCard. Kod ini menggunakan perpustakaan seperti pandas, numpy, matplotlib, scikit-learn, dan tensorflow.
(Contoh kod terperinci dari input asal ditinggalkan di sini untuk keringkasan. Langkah -langkah teras diringkaskan di bawah.)
- Analisis data: Import dan bersihkan dataset saham MasterCard.
- Data Preprocessing: Pecahkan data ke dalam set latihan dan ujian, skala menggunakan
MinMaxScaler
, dan Reshape untuk input model. - Model LSTM: Membina dan melatih model LSTM.
- Hasil LSTM: Menilai prestasi model LSTM menggunakan RMSE.
- Model Gru: Membina dan melatih model GRU dengan seni bina yang serupa.
- Hasil GRU: Menilai prestasi model GRU menggunakan RMSE.
- Kesimpulan: Bandingkan prestasi model LSTM dan GRU.
Kesimpulan
Rangkaian CNN-RNN hibrid semakin digunakan untuk tugas yang memerlukan pemahaman spatial dan temporal. Tutorial ini memberikan pemahaman asas tentang RNN, batasan mereka, dan penyelesaian yang ditawarkan oleh seni bina canggih seperti LSTM dan GRU. Projek ini menunjukkan permohonan LSTM dan GRU untuk ramalan harga saham, menonjolkan prestasi unggul Gru dalam kes tertentu ini. Projek lengkap boleh didapati di ruang kerja DataCamp.
https://www.php.cn/link/8708107b2ff5de15d0244471ae041fdb
ingat untuk menggantikan https://www.php.cn/link/cc6a6632b380f3f6a1c54b1222cd96c2
URL imej diandaikan betul dan boleh diakses.
Atas ialah kandungan terperinci Tutorial Rangkaian Neural Berulang (RNN). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas











Meta's Llama 3.2: Lompat ke hadapan dalam Multimodal dan Mobile AI META baru -baru ini melancarkan Llama 3.2, kemajuan yang ketara dalam AI yang memaparkan keupayaan penglihatan yang kuat dan model teks ringan yang dioptimumkan untuk peranti mudah alih. Membina kejayaan o

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let ’

Landskap AI minggu ini: Badai kemajuan, pertimbangan etika, dan perdebatan pengawalseliaan. Pemain utama seperti Openai, Google, Meta, dan Microsoft telah melepaskan kemas kini, dari model baru yang terobosan ke peralihan penting di LE

Memo CEO Shopify Tobi Lütke baru -baru ini dengan berani mengisytiharkan penguasaan AI sebagai harapan asas bagi setiap pekerja, menandakan peralihan budaya yang signifikan dalam syarikat. Ini bukan trend seketika; Ini adalah paradigma operasi baru yang disatukan ke p

Pengenalan Bayangkan berjalan melalui galeri seni, dikelilingi oleh lukisan dan patung yang terang. Sekarang, bagaimana jika anda boleh bertanya setiap soalan dan mendapatkan jawapan yang bermakna? Anda mungkin bertanya, "Kisah apa yang anda ceritakan?

Pengenalan OpenAI telah mengeluarkan model barunya berdasarkan seni bina "strawberi" yang sangat dijangka. Model inovatif ini, yang dikenali sebagai O1, meningkatkan keupayaan penalaran, yang membolehkannya berfikir melalui masalah MOR

Pernyataan Jadual Alter SQL: Menambah lajur secara dinamik ke pangkalan data anda Dalam pengurusan data, kebolehsuaian SQL adalah penting. Perlu menyesuaikan struktur pangkalan data anda dengan cepat? Pernyataan Jadual ALTER adalah penyelesaian anda. Butiran panduan ini menambah colu

Bagi anda yang mungkin baru dalam lajur saya, saya secara meluas meneroka kemajuan terkini di AI di seluruh papan, termasuk topik seperti yang terkandung AI, penaakulan AI, terobosan berteknologi tinggi di AI, kejuruteraan segera, latihan AI, Fielding of AI, AI Re Re,
