Google, yeni yapay zeka modeli Gemini 1.5’i tanıttı: Tek seferde 1 saatlik videoyu işleyebiliyor!

Google, büyük dil modeli Gemini’yi piyasaya sürülmesinden yalnızca iki ay sonra yeni sürümü Gemini 1.5‘i geliştiriciler ve kurumsal kullanıcılar için tanıttı.

Google, Gemini 1.5’te pek çok alanda gelişme kaydettiğini belirtiyor. Gemini 1.5 Pro, şirketin yakın zamanda piyasaya sürdüğü üst seviye Gemini Ultra ile aynı seviyedeyken, Gemini 1.0 Pro’yu kıyaslama testlerinde yüzde 87 ile geride bırakıyor.

Bu gelişimin, “Uzmanların Karışımı” veya MoE olarak bilinen, giderek yaygınlaşan bir teknik sayesinde gerçekleştiği belirtiliyor. Bu teknikte, bir sorgu gönderildiğinde her şey her zaman işlenmek yerine yalnızca modelin bir kısmını çalıştırılıyor. Bu yaklaşım, modeli hem kullanıcı için daha hızlı, hem de Google için daha verimli hale getiriyor.

Artık çok daha büyük veriyi işleyebiliyor

Ancak Gemini 1.5’te CEO Sundar Pichai başta olmak üzere tüm şirketi özellikle heyecanlandıran yeni bir şey var: Gemini 1.5’in çok büyük bir bağlam penceresi var, bu da çok daha büyük sorguları işleyebileceği ve aynı anda çok daha fazla bilgiye bakabileceği anlamına geliyor. OpenAI’nin GPT-4’ü için 128.000 ve mevcut Gemini Pro için 32.000 rakamına kıyasla 1 milyon token (jeton) seviyesinde bağlam penceresi sunuyor. Daha anlaşılır bir dille ifade etmek gerekirse, tek bir sorgulamayla 700.000’den fazla kelime, bir saatlik video, 11 saatlik ses ve 30.000’den fazla kodu anlayabiliyor ve cevap verebiliyor. Pichai ayrıca Google araştırmacılarının 10 milyon token bağlam penceresini test ettiğini söylüyor. Bu da, Game of Thrones serisinin tamamının aynı anda sorgulanmasına eşdeğer. Google örnek olarak Buster Keaton’un 44 dakikalık filmini veriyor.

Pichai ayrıca daha geniş bağlam penceresinin işletmeler için son derece faydalı olacağını düşünüyor. “Bu, sorgu anında çok sayıda kişisel bağlam ve bilgi ekleyebileceğiniz kullanım senaryolarına olanak tanıyor” diyor. “Sorgu penceresini önemli ölçüde genişlettiğimizi düşünün.” Pichai, film yapımcılarının filmlerinin tamamını yükleyip Gemini’ye eleştirmenlerin ne söyleyebileceğini sorabileceklerini düşünüyor. Ayrıca şirketlerin Gemini’yi çok sayıda mali kaydı incelemek için kullanabileceklerini söyleyerek, “Bunu yaptığımız en büyük atılımlardan biri olarak görüyorum” diyor.

Şimdilik Gemini 1.5, Google’ın Vertex AI ve AI Studio aracılığıyla yalnızca ticari kullanıcılar ve geliştiricilerin kullanımına sunulacak. Daha sonra Gemini 1.0’ın yerini alacak ve Gemini Pro’nun gemini.google.com’da ve şirketin uygulamalarında herkesin kullanımına açık olan standart sürümü, 128.000 token bağlam penceresine sahip Gemini 1.5 Pro olacak. 1 milyona ulaşmak için fazladan ödeme yapmak gerekecek. Google ayrıca, özellikle yeni daha geniş bağlam penceresiyle ilgili olarak modelin güvenlik ve etik sınırlarını da test ediyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir