Menggunakan Kembali Jaringan Dalam yang Ada untuk Teks dan Pemotongan Gambar Berpanduan Estetika
Uncategorized

Menggunakan Kembali Jaringan Dalam yang Ada untuk Teks dan Pemotongan Gambar Berpanduan Estetika

Di jejaring sosial, gambar dilengkapi dengan keterangan dan tag atau jenis label lainnya, yang terkait dengan niat pengguna terhadap gambar tersebut. Oleh karena itu, proses otomatis untuk menyempurnakan gambar, seperti menyediakan tanaman artistik atau membuat gambar mini, akan berguna untuk platform jejaring sosial ini.

Menggunakan Kembali Jaringan Dalam yang Ada untuk Teks dan Pemotongan Gambar Berpanduan Estetika

Mengedit file. Kredit gambar: Magda Ehlers, gambar gratis melalui Pexels

Sebuah makalah baru-baru ini di arXiv.org mengusulkan tugas pemotongan gambar baru. Ini bertujuan untuk memotong gambar secara otomatis berdasarkan niat pengguna dan estetika hasil pemotongan.

Para peneliti mengeksploitasi jaringan yang ada yang dilatih untuk teks gambar dan estimasi estetika dan menggunakannya kembali untuk memotong gambar secara otomatis. Sebuah strategi optimasi baru diusulkan. Alih-alih mengoptimalkan posisi dan skala pangkasan, metode ini hanya mengoptimalkan posisi dan menyesuaikan skala di seluruh pengoptimalan.

Pendekatan yang diusulkan mengungguli metode canggih dan menghasilkan tanaman gambar yang lebih menyenangkan secara visual.

Kami mengusulkan kerangka kerja pengoptimalan baru yang memotong gambar tertentu berdasarkan deskripsi dan estetika pengguna. Tidak seperti metode pemotongan gambar yang ada, di mana seseorang biasanya melatih jaringan dalam untuk mundur ke parameter pemotongan atau tindakan pemotongan, kami mengusulkan untuk secara langsung mengoptimalkan parameter pemangkasan dengan menggunakan kembali jaringan yang telah dilatih sebelumnya pada teks gambar dan tugas estetika, tanpa penyetelan halus, sehingga menghindari pelatihan jaringan terpisah. Secara khusus, kami mencari parameter tanaman terbaik yang meminimalkan kerugian gabungan dari tujuan awal jaringan ini. Untuk membuat tabel optimasi, kami mengusulkan tiga strategi: (i) multi-skala bilinear sampling, (ii) menganil skala wilayah tanaman, sehingga secara efektif mengurangi ruang parameter, (iii) agregasi beberapa hasil optimasi. Melalui berbagai evaluasi kuantitatif dan kualitatif, kami menunjukkan bahwa kerangka kerja kami dapat menghasilkan tanaman yang selaras dengan deskripsi pengguna yang dituju dan menyenangkan secara estetika.

Makalah penelitian: Horanyi, N., Xia, K., Moo Yi, K., Bojja, AK, Leonardis, A., dan Chang, HJ, “Mengganti Jaringan Dalam yang Ada untuk Caption dan Pemotongan Gambar Berpanduan Estetika”, 2021. Tautan: https ://arxiv.org/abs/2201.02280



Posted By : togel hongkon