TY  - BOOK
AU  - Sutton Richard S
AU  - Barto Andrew G
TI  - Reinforcement learning
SN  - 0-262-19398-1
U1  - 006.31 
PY  - 1998///
CY  - Cambridge
PB  - MIT Press
KW  - Reinforcement learning(Machine learning)
ER  -