• Haziran 10, 2022

Google’dan metinleri resme dönüştürebilen yapay zeka algoritması

Google’dan metinleri resme dönüştürebilen yapay zeka algoritması

Google’dan metinleri resme dönüştürebilen yapay zeka algoritması.

Google, yazılı metinleri resme dönüştüren yapay zeka algoritmasını kullanıma açtı. Imagen adlı algoritmanın sonuçları son derece gerçekçi. Şirket, metinleri görüntüye dönüştüren yapay zekanın ‘benzeri görülmemiş bir fotogerçekçilik’ sunduğunu iddia ediyor.

Google metin girişi esasına dayalı görüntüler oluşturabilen bir yapay zeka sistemi geliştirdi. Sistem kullanıcıların herhangi bir açıklayıcı metin girmesi ve yapay zekanın bu metinleri bir görüntüye dönüştürmesi şeklinde çalışıyor.

Şirket, Google Research bünyesindeki beyin ekibi tarafından oluşturulan sistemin “benzeri görülmemiş derecede bir fotogerçekçilik ve derin bir dil anlayışı” sunduğunu belirtiyor.

Bu yapay zeka modellini ilk kez görmüyoruz. Daha önce de OpenAI DALL-E’nin metinleri ne kadar ustalıkla görsellere dönüştürebildiğini sergilemişti. Ancak Google’ın yapay zeka algoritması daha gerçekçi görüntüler oluşturmaya çalışıyor.

Imagen’i diğer metinleri görüntüye çeviren modellere (DALL-E 2, VQ-GAN+CLIP ve Latent Difüzyon Modelleri dahil) karşı değerlendirmek için araştırmacılar çalışma yürütüyor. Çalışma kapsamında her modele 200 metin isteminin girilmesi için bir liste oluşturuldu ve değerlendiricilerinden her bir görüntüyü değerlendirmeleri istendi. Google, “hem örnek kalitesi hem de resim-metin hizalaması açısından yan yana karşılaştırmalarda Imagen diğer modellere tercih ediliyor” dedi.

DALL-E gibi, Imagen’ın da halka açık olmadığını belirtelim. Google, çeşitli nedenlerle sistemin henüz genel kullanıma uygun olduğunu düşünmüyor. En önemli neden olarak da metinden görüntüye modellerin genellikle web’den alınan ve derlenmeyen büyük veri kümeleri üzerinde eğitilmesi ve bunun da bir dizi sorunu beraberinde getirmesi gösteriliyor.

Araştırmacılar, “Bu yaklaşım son yıllarda hızlı algoritmik ilerlemeleri mümkün kılmış olsa da, bu nitelikteki veri kümeleri genellikle sosyal klişeleri, baskıcı bakış açılarını ve marjinalleştirilmiş kimlik gruplarına yönelik aşağılayıcı veya başka türlü zararlı dernekleri yansıtıyor” diyor.

Sonuç olarak, Imagen’in “büyük dil modellerinin sosyal önyargılarını ve sınırlamalarını” miras aldığını ve “zararlı stereotipleri ve temsili” tasvir edebileceği değerlendiriliyor. Çalışma ekibi ön bulguların, yapay zeka algoritmasının daha açık ten tonlarına sahip insanların görüntülerini oluşturma ve onları belirli klişe cinsiyet rollerine yerleştirme eğilimi de dahil olmak üzere sosyal önyargıları kodladığını gösterdiğini söyledi. Ek olarak araştırmacılar, Imagen’in mevcut haliyle olduğu gibi halka sunulması durumunda kötüye kullanım potansiyeli olduğunu belirtti.

yapay zeka algoritması

Ekip, belki de ilerleyen süreçte kendi görüntülerini oluşturmak için insanların modelin bir versiyonuna metin girmesine izin verebilir. Araştırmacılar, “Gelecekteki çalışmalarda, dış denetimin değerini sınırsız açık erişim riskleriyle dengeleyen sorumlu bir dışsallaştırma çerçevesi keşfedeceğiz.” Diyor.

Yine de Imagen’i sınırlı olarak deneyimlemek mümkün. Açık web sitesi üzerinden seçilmiş ifadeleri kullanarak bir açıklama oluşturabilirsiniz. Kullanıcılar, görüntünün fotoğraf mı yoksa yağlı boya mı olacağını, görüntülenen hayvanın türünü, giydikleri giysiyi, üstlendikleri eylemi ve ortamı seçebilirler.