Openai merilis dua model penalaran yang kuat beberapa hari yang lalu yang membuat chatgpt lebih mengesankan. Ini adalah O3 dan O4-Mini yang dapat Anda uji segera di Chatgpt. Mereka jauh lebih baik dalam penalaran daripada pendahulunya dan mungkin unggul dalam pengkodean dan matematika jika itu adalah hobi Anda.
Namun, fitur turning chatgpt baru di O3 dan O4-Mini, setidaknya bagi saya, kemampuan AI untuk menafsirkan data dalam gambar. Pada dasarnya, ChatGPT memiliki visi komputer seperti di film, termasuk kemampuan penalaran yang memungkinkan AI mengekstrak data lokasi dari foto. Anda dapat bertanya kepada AI, “Di mana foto ini diambil?” Dan AI akan melakukan segala daya untuk menjawab.
Chatgpt O3 dan O4-Mini akan memperbaiki keadaan, seperti yang akan Anda lihat dalam tes yang sangat ilmiah saya yang mengikuti. Artinya, mereka akan memperbaiki keadaan bahkan jika saya mencoba menggunakan AI untuk membodohi chatgpt.
Karena ya, saya menggunakan generasi gambar GPT-4O untuk membuat foto seperti hidup dari lokasi ski terkenal di Pegunungan Alpen daripada mengunggah gambar saya yang asli. Saya kemudian mengatakan kepada ChatGPT untuk mengubah gambar itu dengan cara yang akan mengubah cakrawala.
Setelah itu, saya memulai obrolan baru dengan O3 dan O4-Mini, yakin bahwa Chatgpt akan mengenali lokasi di foto palsu yang baru saja saya kirimkan. Saya tidak salah; Kedua model memang memberi saya hasil yang saya harapkan, membuktikan bahwa Anda dapat menggunakan konten yang dihasilkan AI untuk membodohi AI. Tetapi mereka tetap mengejutkan pikiran saya.
Baru -baru ini saya menjelaskan bagaimana algoritma Apple Watch mengecewakan saya saat bermain ski minggu lalu, dan itulah yang saya gunakan sebagai inspirasi dalam percobaan saya untuk menipu AI.
Saya meminta Chatgpt untuk membuat foto yang menunjukkan Puncak Matterhorn terkenal di hari yang cerah, dengan pemain ski menikmati waktu mereka. Foto tersebut harus memiliki rasio aspek 16: 9 dan menyerupai foto iPhone.
Saya mengatakan kepada AI untuk memasukkan gondola di dalamnya untuk ukuran yang baik, tetapi, seperti yang Anda lihat pada percobaan pertama, bahwa gondola tidak pergi ke tempat. Apa pun; Saya hanya membutuhkan gambar pertama dari AI sehingga saya bisa mengubahnya. Masukkan gambar berikut:
Saya menginstruksikan chatgpt untuk menghapus gondola dan menempatkan puncak Matterhorn yang lebih kecil ke kanan.

Saya mengambil tangkapan layar gambar sehingga tidak akan mempertahankan metadata apa pun, dan kemudian mengubah file menjadi foto JPG:

Kemudian, saya memulai dua obrolan terpisah, dengan Chatgpt O3 dan Chatgpt O4-Mini, di mana saya mengunggah foto Matterhorn palsu dan meminta AI untuk memberi tahu saya di mana gambar itu diambil dan bagaimana mereka menemukannya.
Tidak mengherankan, keduanya beralasan model AI berhasil mengidentifikasi Matterhorn sebagai lokasi.
Chatgpt o3
Pertama, kami memiliki O3, yang memberi saya banyak detail tentang bagaimana hal itu menentukan lokasi. AI sangat percaya diri dalam tanggapannya, memberi tahu saya bahwa “mengapit puncak seperti Dent Blanche dan Weisshorn” menceritakan tanda -tanda.

Saya memiliki senyum di wajah saya. Saya telah mengalahkan AI, dengan ai Dengan membuatnya mengenali lokasi di foto palsu. Bahkan lebih baik bahwa O3 begitu yakin dengan dirinya sendiri setelah hanya 34 detik berpikir.

Tapi kemudian saya pikir saya akan mendorong lebih jauh sehingga bisa mengetahui gambar itu palsu. Saya memintanya untuk menggambar lingkaran di Dent Blanche dan Weisshorn.

Di sinilah melihat O3 dalam aksi mengejutkan saya. Kali ini, AI menghabiskan hampir enam menit melihat foto itu, mencoba dengan tepat menunjukkan kedua puncak yang dikatakan bisa dilihat di kejauhan.
Seperti yang akan Anda lihat, Mini Matterhorn di sebelah kanan segera melemparkan AI, tetapi chatgpt tidak berhenti di situ. Itu terus melihat foto dan mencari di web untuk gambar -gambar wilayah Pegunungan Alpen di mana puncak -puncak ini berada.

Itu juga melihat foto untuk menentukan lokasi relatif puncak tambahan di wilayah tersebut. “Saya dapat mencoba overlay perkiraan maxima lokal berdasarkan kecerahan, tapi jujur, saya pikir lebih mudah untuk hanya menggunakan mata saya untuk ini,” pikir O3, dan saya terpesona untuk membacanya.

AI melanjutkan untuk memperbesar untuk melihat bagian -bagian dari foto AI palsu dengan lebih baik:

Itu memotong bagian -bagian gambar yang mencoba mencari tahu detail yang diharapkan berada di sana dalam foto nyata dari area di sekitar Matterhorn. Dalam rangkaian pemikirannya, Chatgpt mengatakan itu tidak bisa melihat bentuk gunung yang menurutnya harus ada di sana.

AI mulai memberi anotasi gambar, mencari jawaban karena terus mencari web untuk lebih banyak gambar yang akan membantunya menunjukkan lokasi dua puncak yang saya minta untuk menempatkan lingkaran merah di sekitarnya.
Seperti yang Anda lihat, mini-matterhorn palsu di sebelah kanan terus membodohi AI.

Pada akhirnya, Chatgpt O3 mengakui ketidakpastian itu tetapi masih memutuskan untuk menandai dua puncak yang saya minta. Ini menjalankan kode ke obrolan dan memberi saya gambar berikut.
Saya ingin sekali melihat chatgpt o3 memanggil tebing saya dan memberi tahu saya foto ini tidak nyata. Mungkin versi AI di masa depan akan dapat melakukan itu. Tetapi saya harus mengatakan bahwa membaca lima menit “berpikir,” kebanyakan dari mereka terlihat pada gambar di atas, bahkan lebih baik.

Itu menunjukkan kepada saya bahwa AI sedang bekerja untuk menyelesaikan pekerjaan dan memperkuat ide saya bahwa visi komputer AI luar biasa dalam versi baru chatgpt ini.
Tapi tunggu, itu menjadi lebih baik.
Chatgpt o4-mini
Eksperimen saya tidak dapat dilakukan tanpa menggunakan chatgpt o4-mini. Bagaimanapun, O4-Mini adalah prekursor O4, yang seharusnya lebih baik dari O3. O4-Mini jauh lebih cepat daripada O3 dalam memberi saya jawabannya.

AI berpikir selama 15 detik, selama waktu itu muncul gambar dari internet untuk mendukung pandangannya bahwa foto yang saya unggah adalah gambar nyata dari Matterhorn.
O4-Mini juga menjelaskan bagaimana mengidentifikasi lokasi, tetapi rasanya benar tentang hal itu. Ini adalah Matterhorn, mengingat semua yang telah dipelajari tentang hal itu dari web.

Tidak seperti Chatgpt O3, O4-Mini tidak menyebutkan puncak tambahan. Tapi saya meminta O4-Mini untuk melakukan hal yang sama seperti O3: Identifikasi Dent Blanche dan Weisshorn.
O4-Mini mengejutkan saya dengan kecepatannya di sini. Butuh 18 detik untuk memberi saya gambar berikut, yang memiliki lingkaran merah di sekitar dua puncak.

Ya, ini bukan pekerjaan yang hebat, dan saya tidak tahu mengapa AI menempatkan lingkaran itu di sana karena transkrip rantai-dipikirkan yang lebih terbatas tidak menjelaskannya.
Jelas salah, mengingat kami bekerja dengan gambar AI palsu di sini. Dan ya, O4-Mini tidak bisa mengatakan foto itu palsu.
The Real Matterhorn
Kesimpulannya jelas, dan tidak semua berita bagus.
Pertama, pembuatan gambar 4o dapat dengan mudah disalahgunakan. Saya sebenarnya belum pernah melihat Matterhorn secara langsung, dan itulah sebabnya saya meminta AI untuk membuat gambar khusus ini. Saya mengenali siluetnya yang terkenal dari foto-foto kehidupan nyata, tetapi saya jelas tidak terbiasa dengan puncak-puncak lain di wilayah ini. Ini menunjukkan bahwa gambar yang dibuat chatgpt dapat membodohi orang. Mereka juga bisa membodohi model AI lainnya.
Kedua, O3 dan O4-Mini luar biasa dalam menganalisis data dalam gambar. Tentu saja, mereka harus. Jika 4o dapat membuat foto yang menakjubkan dan seperti hidup, itu karena AI dapat menafsirkan data dalam gambar.
Ketiga, menemukan informasi lokasi dari foto akan sepele mudah untuk model OpenAI seperti O3 dan O4-Mini. Pesaing mungkin akan mendapatkan kekuatan yang sama. Ini adalah masalah privasi yang perlu kita pertanggungjawabkan di masa depan.
Keempat, Chatgpt O3 menanggapi pekerjaan dengan sangat serius. Jika menghabiskan waktu sepanjang waktu untuk foto AI palsu mencoba mencocokkannya dengan dunia nyata, itu akan menghabiskan waktu yang sama pada pekerjaan lain yang mungkin Anda lemparkan, dan itu akan menggunakan banyak alat yang tersedia di ChatGPT (seperti pengkodean, pencarian web, manipulasi gambar) untuk menyelesaikan pekerjaan.
Saya yakin jika saya menghabiskan lebih banyak waktu dengan penalaran AI atas gambar, kami akhirnya akan mencapai kesimpulan bahwa gambar yang diselidiki AI itu palsu.
Kelima, chatgpt o4-mini bisa sangat cepat. Terlalu cepat. Ini adalah sesuatu yang Anda inginkan dari Genai Chatbots, tetapi juga sesuatu yang perlu dikhawatirkan. O4-Mini juga tidak mengenali foto palsu itu, tetapi pendekatannya jauh lebih sederhana. Itu membuat saya berpikir Anda perlu memberikan perhatian ekstra ketika bekerja dengan versi mini untuk memastikan AI menyelesaikan pekerjaan. Tapi hei, saya bekerja dengan eksperimen yang sangat terbatas di sini.
Akhirnya, inilah materi dan daerah sekitarnya dari klip YouTube yang diunggah pada bulan Desember 2020. Saya mengatakan itu karena, di zaman AI, video yang akan Anda lihat selalu bisa menjadi palsu. Video ini memberi Anda “pemandangan dari atas Weisshorn Nordwand yang memandang ke arah Matterhorn (L) dan Dent Blanche (R). Gunung Blanc terlihat di kejauhan (jauh R).” Ini sudut yang berbeda, tetapi setidaknya cukup baik untuk memberi Anda gambaran tentang apa yang dicari Chatgpt O3.