Rumah Peranti teknologi AI Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Mar 12, 2025 pm 01:12 PM
git ai Mel industri Pokémon DeepSeek 视觉强化 qwen

Cadangan Besar: Visual-RFT-Projek Sumber Terbuka Visual-RFT-Peningkatan Visual dan Fine-Penalaan untuk Memperkasakan Model Bahasa Visual!

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Lajur AIXIV terus memberi tumpuan kepada penyelidikan AI teratas di dunia dan telah menerbitkan lebih daripada 2,000 artikel akademik dan teknikal. Selamat datang untuk menyumbang untuk berkongsi pencapaian cemerlang anda! E -mel penyerahan: liyazhou@jiqizhixin.com;

Projek Visual-RFT (Penguatkuasaan Visual Fine-penalaan) berjaya menerapkan paradigma Pembelajaran Pembelajaran dan Penguatkuasaan Penguatkuasaan (RFT) yang berdasarkan kepada Model Besar Bahasa Visual (LVLM), memecahkan batasan kaedah terdahulu yang terhad kepada teks, matematik dan bidang lain. Dengan merancang ganjaran peraturan khusus untuk tugas-tugas seperti subkategori visual dan pengesanan objek, Visual-RFT memberikan idea baru untuk latihan LVLM!

Rajah 1 menunjukkan keupayaan generalisasi yang kuat dari Visual-RFT: Model ini hanya memerlukan sedikit data untuk mengenal pasti Pokémon tertentu dengan tepat dalam Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber dan mencari koordinatnya.

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Rajah 1. Visual-RFT memanjangkan penalaan halus kepada multimodal, dengan hanya 10-1000 keping data untuk meningkatkan prestasi model dengan ketara.

Dari RFT ke Visual-RFT: Terobosan dalam pembelajaran tetulang dalam bidang multimodal

Teknologi penalaan yang dipertingkatkan dengan OpenAI membolehkan penghijrahan keupayaan model dicapai dengan hanya sebilangan kecil sampel. DeepSeek-R1 mendedahkan bahawa kebolehan penalarannya yang kuat berasal dari strategi pembelajaran tetulang berdasarkan ganjaran yang dapat disahkan. Walau bagaimanapun, strategi ini sebelum ini digunakan terutamanya dalam bidang seperti teks dan matematik. Visual-RFT berjaya memperluaskan strategi ini ke medan visual.

Arahan Visual Tradisional Penalaan halus (SFT) memerlukan sejumlah besar data, dan keupayaan pembelajaran sampel kecil Visual-RFT menjadikannya lebih berfaedah dalam senario data yang terhad.

Untuk mengesahkan keupayaan generalisasi Visual-RFT, pasukan penyelidikan menjalankan ujian pada pelbagai tugas visual seperti pengesanan objek, klasifikasi, dan asas. Hasilnya menunjukkan bahawa Visual-RFT dapat mencapai peningkatan prestasi yang signifikan di bawah perbendaharaan kata terbuka, pembelajaran sampel kecil dan tetapan lain, dan lebih baik daripada kaedah SFT. Terutama dalam tugas kedudukan kesimpulan, Visual-RFT menunjukkan keupayaan penalaran visual yang sangat baik. (Lihat kertas untuk maklumat lanjut)

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Rajah 2. Visual-RFT melampaui SFT pada pelbagai tugas visual.

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Rajah 3. Rajah rangka kerja Visual-RFT, mengemas kini parameter model menggunakan strategi pembelajaran IOU dan CLS dan tetulang.

Pasukan penyelidikan menggunakan ganjaran yang boleh disahkan berasaskan IOU untuk mengesan dan memberi tugas, dan ganjaran CLS berdasarkan ketepatan klasifikasi untuk tugas klasifikasi. (seperti yang ditunjukkan dalam Rajah 3)

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Rajah 4. Keputusan kedudukan inferensi menunjukkan bahawa visual-RFT melampaui SFT untuk mencari objek dengan lebih tepat.

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Rajah 5. Hasil klasifikasi halus yang menyimpulkan menunjukkan bahawa Visual-RFT melampaui SFT untuk mencari objek dengan lebih tepat.

Rajah 4 dan Rajah 5 menunjukkan hasil output model.

Hasil percubaan visual-RFT

Berdasarkan model QWEN2-VL 2B/7B, Visual-RFT secara komprehensif melepasi SFT dalam pengesanan objek terbuka, pengesanan sampel kecil, klasifikasi halus dan tugas kedudukan kesimpulan. Data eksperimen merangkumi adegan biasa seperti COCO dan LVI dan adegan terbuka seperti watak -watak kartun Internet. Dengan hanya sedikit data, Visual-RFT dapat mencapai penghijrahan keupayaan, menunjukkan prestasi dan keteguhan yang sangat baik.

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber

Rajah 5. Beberapa keputusan eksperimen menunjukkan bahawa Visual-RFT melampaui SFT.

Visual-RFT adalah sumber terbuka!

Projek Visual-RFT adalah sumber terbuka dan mengandungi latihan, kod penilaian dan data. Selamat datang untuk mengambil bahagian!

Alamat Projek: https://www.php.cn/link/ec56522bc9c2e15be17d11962eeec453

Atas ialah kandungan terperinci Peningkatan penalaan visual! Teknologi DeepSeek R1 telah berjaya dipindahkan ke medan multimodal dan terbuka sepenuhnya ke sumber. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Sistem Fusion, dijelaskan
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1666
14
Tutorial PHP
1273
29
Tutorial C#
1253
24
Bagaimana untuk mendaftar di pertukaran OK di China? OK Platform Perdagangan dan Panduan Gunakan Panduan untuk Pemula di Tanah Besar China Bagaimana untuk mendaftar di pertukaran OK di China? OK Platform Perdagangan dan Panduan Gunakan Panduan untuk Pemula di Tanah Besar China May 08, 2025 pm 10:51 PM

Dalam pasaran cryptocurrency, memilih platform perdagangan yang boleh dipercayai adalah penting. Sebagai pertukaran aset digital yang terkenal di dunia, platform perdagangan OK telah menarik sejumlah besar pengguna pemula di tanah besar China. Panduan ini akan memperkenalkan secara terperinci bagaimana untuk mendaftar dan menggunakannya di platform perdagangan OK untuk membantu pengguna pemula bermula dengan cepat.

10 aplikasi perdagangan mata wang maya digital teratas pada 2025 Ringkasan 10 aplikasi pertukaran mata wang digital teratas 10 aplikasi perdagangan mata wang maya digital teratas pada 2025 Ringkasan 10 aplikasi pertukaran mata wang digital teratas May 08, 2025 pm 05:24 PM

Kedudukan sepuluh aplikasi perdagangan mata wang maya digital teratas pada tahun 2025: 1. Binance: Memimpin dunia, menyediakan urus niaga yang efisien dan pelbagai produk kewangan. 2. OKX: Ia adalah inovatif dan pelbagai, menyokong pelbagai jenis urus niaga. 3. Huobi: stabil dan boleh dipercayai, dengan perkhidmatan berkualiti tinggi. 4. Coinbase: Bersahabat untuk pemula dan antara muka yang mudah. 5. Kraken: Pilihan pertama untuk peniaga profesional, dengan alat yang berkuasa. 6. Bitfinex: Perdagangan yang cekap, pasangan perdagangan yang kaya. 7. Bittrex: Pematuhan Keselamatan, Kerjasama Kawalan.

2025 Binance Binance Exchange Portal Login Terkini 2025 Binance Binance Exchange Portal Login Terkini May 07, 2025 pm 07:03 PM

Sebagai pertukaran cryptocurrency terkemuka di dunia, Binance sentiasa komited untuk menyediakan pengguna dengan pengalaman perdagangan yang selamat dan mudah. Dari masa ke masa, Binance terus mengoptimumkan ciri platformnya dan antara muka pengguna untuk memenuhi keperluan pengguna yang berubah -ubah. Pada tahun 2025, Binance melancarkan portal log masuk baru yang bertujuan untuk meningkatkan pengalaman pengguna.

10 alat terkini untuk pemaju web 10 alat terkini untuk pemaju web May 07, 2025 pm 04:48 PM

Reka bentuk pembangunan web adalah bidang kerjaya yang menjanjikan. Walau bagaimanapun, industri ini juga menghadapi banyak cabaran. Memandangkan lebih banyak perniagaan dan jenama beralih ke pasaran dalam talian, pemaju web mempunyai peluang untuk menunjukkan kemahiran mereka dan berjaya dalam kerjaya mereka. Walau bagaimanapun, apabila permintaan untuk pembangunan web terus berkembang, bilangan pemaju juga semakin meningkat, mengakibatkan persaingan yang semakin sengit. Tetapi ia menarik bahawa jika anda mempunyai bakat dan kehendak, anda sentiasa dapat mencari cara baru untuk membuat reka bentuk dan idea yang unik. Sebagai pemaju web, anda mungkin perlu terus mencari alat dan sumber baru. Alat dan sumber baru ini bukan sahaja menjadikan pekerjaan anda lebih mudah, tetapi juga meningkatkan kualiti kerja anda, dengan itu membantu anda memenangi lebih banyak perniagaan dan pelanggan. Trend pembangunan web sentiasa berubah.

AI dan Komposer: Meningkatkan Kualiti dan Pembangunan Kod AI dan Komposer: Meningkatkan Kualiti dan Pembangunan Kod May 09, 2025 am 12:20 AM

Dalam komposer, AI terutamanya meningkatkan kecekapan pembangunan dan kualiti kod melalui cadangan ketergantungan, resolusi konflik pergantungan dan peningkatan kualiti kod. 1. AI boleh mencadangkan pakej ketergantungan yang sesuai mengikut keperluan projek. 2. AI menyediakan penyelesaian pintar untuk menangani konflik pergantungan. 3. AI mengkaji kod dan menyediakan cadangan pengoptimuman untuk meningkatkan kualiti kod. Melalui fungsi ini, pemaju boleh memberi tumpuan lebih kepada pelaksanaan logik perniagaan.

10 platform cryptocurrency teratas di dunia yang menyokong urus niaga pelbagai rantaian dikeluarkan pada tahun 2025 10 platform cryptocurrency teratas di dunia yang menyokong urus niaga pelbagai rantaian dikeluarkan pada tahun 2025 May 08, 2025 pm 07:15 PM

Menurut penilaian terkini dan trend industri dari institusi yang berwibawa pada tahun 2025, berikut adalah platform sepuluh cryptocurrency teratas di dunia yang menyokong urus niaga pelbagai rantaian, menggabungkan jumlah transaksi, inovasi teknologi, pematuhan dan analisis komprehensif reputasi pengguna:

Alamat web dalam talian 2025 Binance Alamat web dalam talian 2025 Binance May 07, 2025 pm 06:54 PM

Sebagai pertukaran cryptocurrency terkemuka di dunia, Binance sentiasa komited untuk menyediakan pengguna dengan pengalaman perdagangan yang selamat dan mudah. Dari masa ke masa, Binance terus mengoptimumkan ciri platformnya dan antara muka pengguna untuk memenuhi keperluan pengguna yang berubah -ubah. Pada tahun 2025, Binance melancarkan portal log masuk baru yang bertujuan untuk meningkatkan pengalaman pengguna.

Alamat Masuk Terkini Binance Exchange pada tahun 2025 Alamat Masuk Terkini Binance Exchange pada tahun 2025 May 07, 2025 pm 07:00 PM

Sebagai pertukaran cryptocurrency terkemuka di dunia, Binance sentiasa komited untuk menyediakan pengguna dengan pengalaman perdagangan yang selamat dan mudah. Dari masa ke masa, Binance terus mengoptimumkan ciri platformnya dan antara muka pengguna untuk memenuhi keperluan pengguna yang berubah -ubah. Pada tahun 2025, Binance melancarkan portal log masuk baru yang bertujuan untuk meningkatkan pengalaman pengguna.

See all articles