OpenAI, ChatGPT'nin Görüntü Oluşturma Özelliğini Geliştiriyor

Voyra AI

2025-04-03

⏱️ Tahmini okuma süresi: 3 dakika

OpenAI, GPT-4o adlı yeni bir görsel üretim modelini doğrudan ChatGPT'ye entegre etti, önceki DALL-E 3 entegrasyonunun yerini alarak çok modlu işlem ve geliştirilmiş metin işleme gibi iyileştirilmiş yetenekler sundu. TechCrunch tarafından bildirildiğine göre, bu yükseltme, ChatGPT'nin daha detaylı ve doğru görseller oluşturmasını sağlıyor. Yeni sistem, farklı kullanıcı seviyelerine sunulmuş durumda ve geliştiriciler için API erişimi yakında geliyor.

GPT-4o Görüntü Oluşturucu Dağıtımı

GPT-4o'nun görsel üretim yeteneklerinin dağıtımı 25 Mart 2025'te başladı ve bu, ChatGPT'nin görsel yaratma yeteneklerinde önemli bir yükseltme anlamına geliyor. Bu yeni özellik, Plus, Pro, Team ve Free kullanıcılarına sunulmuş durumda, Enterprise ve Education kullanıcıları ise yakında erişim sağlayacak. Ücretsiz kullanıcılar günde 3 görsel ile sınırlıyken, Plus ve daha yüksek seviyedeki aboneler sınırsız görsel oluşturabiliyor. Entegrasyon, önceki DALL-E 3 sistemine kıyasla daha tutarlı sonuçlar ve daha az içerik kısıtlaması sunmayı amaçlıyor. Geliştiriciler, önümüzdeki haftalarda GPT-4o görsel üretimi için API erişimi bekleyebilir ve bu da çeşitli platformlar ve uygulamalar arasında daha geniş bir uygulama alanı sağlamayı mümkün kılacak.

GPT-4o'nun Gelişmiş Özellikleri

GPT-4o, selefinden ayıran birkaç gelişmiş özelliğe sahiptir. Model, 20 farklı öğeyi aynı anda işleyebilirken, aralarındaki ilişkileri doğru bir şekilde korur, bu da onu karmaşık sahne üretimi için ideal hale getirir. Bağlamsal farkındalığı, sohbet bağlamındaki resimler ve metinler üzerine inşa yapmasına olanak tanır ve iterasyonlar boyunca tutarlılık sağlar. Ayrıca, GPT-4o bağlam içi öğrenmede mükemmeldir, kullanıcıların yapay zekanın analiz etmesi için resimler yüklemelerini ve bu detayları yeni üretimlere dahil etmelerini sağlar. Üretilen görsellerin karmaşıklığı ve detayları nedeniyle işleme süresi bir dakikaya kadar çıkabilir, ancak sonuçlar genellikle önceki modellere kıyasla daha görsel olarak çarpıcı ve detaylarda daha net olur.

Gelişmiş Kullanıcı Deneyimi

ChatGPT'deki yeni görsel üretim sistemi, kullanıcılar için sadeleştirilmiş bir deneyim sunuyor. Kullanıcılar, modelden belirli detaylarla bir görsel oluşturmasını isteyebilir veya kompozörde "Görsel oluştur" seçeneğini seçebilirler. Sistem, görselleri hassas gereksinimlerle özelleştirmeye olanak tanır; bu, en boy oranı, hex kodlarıyla tam renkler ve şeffaf arka planlar gibi özellikleri içerir. Bu entegrasyon, görsel oluşturmayı yapay zeka destekli iletişimin önemli bir parçası haline getiriyor ve kullanıcıların doğal bir konuşma ile görselleri geliştirirken tutarlı bir stil korumalarını sağlıyor. GPT-4o'nun geliştirilmiş yetenekleri, metin, eller ve yüzler gibi karmaşık öğeleri içeren son derece doğru ve detaylı görseller üretmesini sağlar ve geniş ve detaylı istemlere etkili bir şekilde yanıt verir.

Ayrı Seçenek Olarak DALL-E

GPT-4o, ChatGPT'ye entegre edilen birincil görsel üretim modeli haline gelirken, OpenAI, DALL-E'yi kullanıcıların belirli yeteneklerini tercih edenler için ayrı bir seçenek olarak tutmuştur. DALL-E, kullanıcıların ihtiyaçlarına göre iki model arasında geçiş yapmalarını sağlayacak özel bir GPT aracılığıyla erişilebilir olacak. Bu karar, kullanıcıların DALL-E'nin stilize edilmiş veya sanatsal görseller üretme gibi benzersiz güçlü yönlerinden hala faydalanabilmelerini sağlarken, aynı zamanda GPT-4o'nun gelişmiş özelliklerine de erişim sunar. Her iki modelin de mevcut olması, kullanıcıların görsel üretim görevlerinde daha fazla esneklik ve seçenek sunar, böylece daha geniş bir yaratıcı ve pratik uygulama yelpazesine hitap eder.