Pembelajaran pengukuhan

Daripada Wikipedia, ensiklopedia bebas.
Lompat ke: pandu arah, cari

Berinspirasikan psikologi tingkah laku, pembelajaran pengukuhan ialah satu kawasan pembelajaran mesin dan sains komputer, mengenai cara satu agen akan mengambil tindakan dalam satu persekitaran untuk memaksimumkan sesetengah tanggapan ganjaran longgokan.

Rujukan[sunting | sunting sumber]

Pautan luar[sunting | sunting sumber]


Wiki letter w.svg

 Rencana ini merupakan rencana tunas. Anda boleh membantu Wikipedia dengan mengembangkannya.