
OpenAI, dil modellerinin sadece metinle değil, aynı zamanda görsel içerik oluşturma konusunda da güçlü olmasını hedefleyerek GPT-4o modelini daha ileriye taşıdı. Bu yeni güncelleme, modelin bugüne kadar entegre edilen en güçlü görüntü oluşturma yeteneklerini sunuyor.
Yeni özellikler, ChatGPT Pro, Plus ve Team aboneliklerine sahip kullanıcılara sunulacak. Beklenenden fazla ilgi gördüğü için, GPT-4o’nun gelişmiş görsel oluşturma yetenekleri kısa süre içinde ChatGPT‘nin ücretsiz kullanıcı kitlesine de açılacak.
GPT-4o’nun görsel oluşturma yetenekleri, metinleri görsellere doğru bir şekilde entegre etme, yüklenen görsellerden ilham alarak yaratıcı içerikler üretme ve karmaşık talepleri yerine getirme konusunda kayda değer bir ilerleme kaydetti. Bu sayede yeni model, görsel iletişimi güçlendiren ve yaratıcı süreçleri destekleyen güçlü bir araç olarak öne çıkıyor.
GPT-4o, görseller ve metin arasındaki ilişkiyi derinlemesine kavrayacak şekilde eğitildi. Çevrimiçi görsellerin ve metinlerin ortak dağılımlarını analiz ederek, sadece görsellerin nasıl yorumlanması gerektiğini değil, aynı zamanda görseller arasındaki ilişkileri de öğreniyor. Bu sayede, daha doğru ve anlamlı görseller oluşturulabiliyor.
Bir önceki model olan GPT-4o Turbo‘ya kıyasla GPT-4o, kullanıcıların daha akıcı, tutarlı ve bağlama duyarlı görseller üretmesine olanak tanıyor. Ayrıca, talimatları daha hassas bir şekilde takip ederek, karmaşık sahnelerde 10 ila 20 nesneye kadar doğru görseller üretebiliyor. Bu gelişmeler, görsel iletişimde daha etkili bir deneyim sunmayı amaçlıyor.