Satranç ustası bir yapay zekâ: AlphaZero

YENİ BİR ÇAĞ BAŞLIYOR

Kendi kendine öğrenebilen yapay zekâ uygulamaları alanında önemli bir adım olarak görülen AlphaZero, türünün, Deep Blue’dan bu yana gösterdiği gelişimin, adeta nihai bir örneği. Yirmi yıl önce dünya satranç şampiyonu Gary Kasparov’u yenen Deep Blue, bugün birbiri ardına karşılaştığımız yapay zekâ robot ve algoritmalarının öncüsü sayılıyor.

Aradan geçen yıllarda bilgisayarlar daha da akıllandı. Artık sadece bir oyunda değil, dünyanın en zor üç strateji oyununda iddialı olabilen örneklere rastlıyoruz. Üstelik insan şampiyonları yenmek de mesele olmaktan çıktı; artık kendi aralarında yarışıyorlar.

***

Kendisini deneyimle geliştiren AlphaZero, ilk başta sadece oyunun temel kurallarını öğrendi. Diğer bir deyişle; oyuna yeni başlayan bir insan gibi davrandı. Bu esnada bir oyun partnerine de ihtiyaç duymadan, kendi kendine oynayarak hızla gelişmeyi başardı. Kendisine karşı oynadığı ilk oyunda tamamen rastgele hamleler yaptı. İkinci oyunda biraz daha iyiydi ama hala pek de zekice hamleler yapamadığı ortadaydı. Dokuz saat boyunca aralıksız oynadığında, tüm zamanların en iyi yapay zekâ satranç oyuncusu oldu.

Hiç ara vermeden oynamaya devam ettiği için oyunun, ancak bir antrenör eşliğinde öğrenebilecek tüm inceliklerini yine kendi kendine keşfedebilecek kadar da becerikli olduğunu tahmin edersiniz. Sonuçta doğru hamleler yapıp bunları daha ileriye taşıması ve bir satranç ustasına dönüşmesiyle artık sadece insanları değil, aynı oyunu yıllardır oynamakta olan diğer yapay zekâ uygulamalarını da rahatlıkla geride bırakacak seviyeye erişti.

***

Satrançta, derin ve doğru analizle ilerlemek için, taktik ve stratejiyi iyi kurmak gerekiyor. Taktik, oyuncunun ne yapacağını belirlerken, strateji “ne yapmayacağı” üzerine kurulu.  İyi bir oyuncunun taktik becerileri; kombinezon görüşü ve varyant hesaplama başarısına bağlı.

İlkinin sırrı, zekice planlanmış, göze çarpmayan, hayal gücü gerektiren hamleleri bulmakta yatıyor. Varyant hesaplama ise bir düşünme şekli olarak özetlenebilir. Birbirinden farklı varyant hesaplama yöntemleri var ki bunların hepsi birer ‘varyant ağacı’ oluşturuyor. Bir oyuncu ne kadar ustaysa o kadar az varyant hesaplıyor çünkü artık daha gelişmiş oyun sezgilerine sahip oluyor.

AlphaZero da işte tam olarak bunu yaptı; daha önce hiçbir yapay zekâ oyuncusu tarafından başarılamamış bir şeyi. Yani sezgi geliştirdi.

Varyantlar ağaca benzer yapılara sahip. Monte Carlo Ağacı Araması adlı yöntemi kullanan bu yapay zekânın her bir hamlesi 800 adet hamle dizisi oluşturuyor.


POPULAR SCIENCE Dergisi, Ocak 2019

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir