Openai membawa generasi gambar GPT-4O ke chatgpt dan sora

Openai meluncurkan generasi gambar GPT -4O minggu ini, memberikan model AI andalan perusahaan kemampuan untuk menghasilkan gambar yang tepat dan fotorealistik dan mengedit gambar yang diunggah. Ini juga pertama kalinya pengguna dapat menghasilkan gambar secara langsung di dalam chatgpt – fitur yang telah ada di banyak daftar keinginan selama bertahun -tahun.

“Kami melatih model kami tentang distribusi bersama gambar dan teks online, tidak hanya belajar bagaimana gambar berhubungan dengan bahasa, tetapi bagaimana mereka saling berhubungan,” jelas Openai. “Dikombinasikan dengan pasca-pelatihan yang agresif, model yang dihasilkan memiliki kelancaran visual yang mengejutkan, mampu menghasilkan gambar yang berguna, konsisten, dan sadar konteks.”

Anda dapat melihat kemampuan pembuatan gambar yang baru beraksi dalam video di bawah ini:

Openai mengatakan bahwa membuat dan mengedit gambar tidak berbeda dengan berbicara dengan chatgpt. Jelaskan apa yang ingin Anda lihat dan memasukkan spesifik seperti rasio aspek atau kode hex. Karena gambarnya sangat terperinci, mereka mungkin memakan waktu hingga satu menit untuk diterjemahkan.

Mungkin peningkatan yang paling mengesankan dari pembuatan gambar 4O adalah kemampuannya untuk membuat teks. Salah satu tanda-tanda gambar yang dihasilkan AI telah lama kacau, teks yang tidak masuk akal. GPT-4O cukup pintar untuk mengetahui bagaimana tidak hanya membuat kata-kata bahasa Inggris tetapi juga menempatkannya dalam urutan yang benar. Anda dapat melihat satu contoh yang mengesankan di bawah ini:

4o pembuatan gambar juga dapat membuat teks secara akurat. Sumber Gambar: OpenAi

Pembuatan gambar 4o juga mampu membangun gambar dan teks dalam konteks obrolan, mengikuti petunjuk terperinci dengan perhatian terhadap detail, menganalisis dan belajar dari gambar yang diunggah pengguna, dan menghubungkan pengetahuan dunianya antara teks dan gambar.

Tentu saja, itu tidak sempurna. Beberapa masalah generator gambar termasuk memangkas gambar panjang terlalu erat, membuat informasi, dan berjuang untuk membuat bahasa non-Latin.

4o generasi gambar diluncurkan sekarang untuk pengguna plus, pro, tim, dan gratis sebagai generator gambar default di chatgpt. Enterprise dan EDU akan segera mendapatkan akses, dan pengembang akan dapat menghasilkan gambar dengan GPT -4O melalui API dalam beberapa minggu mendatang. Ini juga tersedia di Sora dan bahkan melalui dall khusus · e gpt untuk dall · e diehards.