Teori permainan

Daripada Wikipedia, ensiklopedia bebas.

Teori permainan adalah salah satu cabang matematik gunaan yang mengkaji individu(pemain) membuat keputusan yang terbaik dalam sesuatu situasi. Teori permainan memodelkan bagaimana agen-agen (misalnya, manusia) bersaling tindak apabila hasil tindakan sesuatu agen itu bergantung kepada tindakan agen yang lain (yang diluar kawalan agen pertama). Biasanya, agen mempunyai kepintaran yang membolehkannya belajar dari keadaan dahulu dan juga merangka strategi.

Teori permainan digunakan dalam sains komputer, terutama kepintaran buatan, untuk misalnya, membina permainan komputer. Dalam ekonomi, ia digunakan untuk memodelkan pembuatan keputusan. Ia juga digunakan untuk model-model salingtindak antara unsur-unsur dalam ekologi. Kini teori permainan banyak digunakan dalam model-model multiagen dalam fizik sosial dan ekonofizik.

Teori permainan moden bermula dengan idea keseimbangan strategi campuran dalam permainan hasil tambah sifar dua orang dan dibuktikan oleh John Von Neumann. Bukti asal Von Neumann menggunakan teorem titik tetap Brouwer pada pemetaan berterusan ke dalam set cembung padat, yang menjadi kaedah standard dalam teori permainan dan ekonomi matematik. Kertas kerjanya telah dibukukan dengan tajuk Theory of Games and Economic behaviour pada tahun 1944. Buku beliau juga mempunyai seorang penulis bersama lain yang bernama Oskar Morgenstern, yang menganggap sebagai permainan pakatan beberapa pemain. Edisi kedua buku ini menyediakan teori aksiomatik utiliti dijangka yang membenarkan ahli statistik matematik dan ahli ekonomi menangani pembuatan keputusan di bawah keadaan ketidakpastian.

Teori permainan telah dibangunkan secara meluas pada tahun 1950-an oleh ramai sarjana. Ia digunakan secara eksplisit pada evolusi pada tahun 1970-an, walaupun perkembangan serupa berlaku sekurang-kurangnya pada tahun 1930-an. Teori permainan telah diiktiraf secara meluas sebagai alat penting dalam pelbagai bidang seperti ekonomi, perniagaan, politik dan sebagainya. Sehingga tahun 2020, Hadiah Memorial Nobel dalam Sains Ekonomi telah diberikan kepada pakar teori permainan iaitu Paul Milgrom dan Robert B. Wilson dan lima belas pakar teori permainan lain-lain yang memenangi Hadiah Nobel Ekonomi. John Maynard Smith telah dianugerahkan Hadiah Crafoord untuk aplikasi teori permainan evolusinya.

Jenis Permainan[sunting | sunting sumber]

Permainan pakatan

Pemain dalam permainan ini boleh berunding dengan pemain lain untuk mengikat perjanjian bersama bagi mengambil strategi bersama.


Permainan bukan pakatan

Pemain dalam permainan ini tidak melakukan rundingan dengan pemain lain untuk mengambil strategi bersama.

Permainan dua orang[sunting | sunting sumber]

Dalam sains komputer, permainan boleh dilihat sebagai penggelintaran ruang keadaan (atau graf keadaan bila keadaan-keadaan yang dibenarkan adalah diskret), dan pergerakan diwakilkan ke atas suatu pepohon gelintaran.

Bagi permainan di antara dua pemain, graf minimaks diperolehi di mana diandaikan setiap pemain akan melakukan pergerakan yang paling menguntungkan masing-masing.

Bagi permainan satu pergerakan, di mana setiap pemain membuat pilihan serentak, kita boleh wakilkan permainan dengan suatu matriks ganjaran, yang memberikan ganjaran yang diperolehi sesuatu pemain bergantung kepada pilihannya dan juga pilihan pemain kedua.


Beberapa permainan[sunting | sunting sumber]

Dilema banduan. Permainan dua orang satu pergerakan di mana pemain punyai dua pilihan: kerjasama (k) atau belot (b). Jika kedua-dua pemain pilih k, kedua-duanya mendapat ganjaran positif, tetapi jika pemain 1 pilih k dan pemain 2 b, maka pemain 2 mendapat ganjaran lebih besar, sementara pemain 1 mendapat hukuman (ganjaran negatif). Jika kedua-duanya b, maka kedua-duanya tidak memperolehi apa-apa (ganjaran sifar). Permainan ini telah digunakan sebagai model untuk menerangkan evolusi kerjasama (di sebalik ketamakan kemandirian yang tercocok) oleh John Maynard Smith.

Hanyutan salji atau Ayam. Ini seperti dilema banduan, cuma apabila kedua-dua pemain belot, kedua-dua mendapat hukuman yang lebih berat daripada yang didapati oleh sipembelot dalam kes satu belot sahaja. Ini dikatakan memerihal banyak perlawanan di antara haiwan, terutama yang memanjang.

Buruan rusa. Ini juga seperti dilema banduan, cuma di sini ganjaran kerjasama dalam kes pemain yang lain belot, adalah kurang daripada ganjaran kerjasama dalam kes kedua-duanya kerjasama.

Permainan minoriti. Banyak pemain diberi dua pilihan. Ganjaran diperolehi apabila memilih pilihan yang paling kurang dipilih pemain lain. Permainan diperkenalkan oleh Zhang dan Challet, menjadi satu paradigma dalam ekonofizik.

Dilema penyimpang. Ramai pemain pilih di antara "penyimpang" (D) dan "pseudo" (P). P untung selagi ada D untuk diperkudakan. Mohd Azhar Abdul Karim dan Wan Ahmad Tajuddin Wan Abdullah memperkenalkan permainan ini untuk memodel persekitaran akademik.

Batu-burung-air. "O-zom" dalam permainan kanak-kanak, ialah permainan dua orang dengan tiga pilihan. Batu kalah kepada air, tetapi air kalah kepada burung, dan burung kalah kepada batu.