Cogito NTNU

Reinforcement Learning // AlphaZero

-Project lead: Agnar Martin Bjørnstad

I dette prosjektet skal vi sammen implementere og trene AlphaZero algoritmen på et (eller flere) spill. Du vil lære om hvordan algoritmen er oppbygd for å kunnelære av å spille mot seg selv, i tillegg til å kunne implementere dette. Forkunnskaper: Python og det kan være en fordel om en er litt kjent med nevrale nettverk.