Pembelajaran pengukuhan

Daripada Wikipedia, ensiklopedia bebas.
Lompat ke: pandu arah, cari

Berinspirasikan psikologi tingkah laku, pembelajaran pengukuhan ialah satu kawasan pembelajaran mesin dan sains komputer, mengenai cara satu agen akan mengambil tindakan dalam satu persekitaran untuk memaksimumkan sesetengah tanggapan ganjaran longgokan.

Rujukan[sunting | sunting sumber]

Pautan luar[sunting | sunting sumber]


Jika Anda melihat rencana yang menggunakan templat {{tunas}} ini, gantikanlah ia dengan templat tunas yang lebih spesifik.