Ada dua perangkat jaringan dalam AlphaGo. Pertama adalah jaringan nilai (value network), yang bertugas melihat posisi bidak pada papan Go dan memutuskan siapa yang akan menang dan mengapa ia menang. Kedua adalah jaringan kebijakan (policy network), yang memutuskan langkah apa yang akan diambil.
Dalam proses pengembangannya AlphaGo terus dilatih dengan bermain menghadapi program-program komputer Go lainnya. Ia memenangkan 499 dari 500 laga yang digelar. Pada Oktober 2015 lalu, ia mengalahkan Hui.
"Sistem ini mencari (langkah) dengan memainkan permainan ini berulang-ulang kali dalam imajinasinya sendiri. Ini yang membuat pencarian AlphaGo lebih mirip manusia ketimbang mesin-mesin sebelumnya," kata David Silver, ilmuwan yang bersama Hassabis mengembangkan AlphaGo.
Sebelum AlphaGo, keberhasilan kecerdasan buatan pertama mengalahkan manusia adalah ketika Deep Blue dari IBM mengalahkan juara catur dunia, Garry Kasparov pada 1997 silam. (Phys.org/AFP/Live Science)