TY - BOOK AU - Sutton Richard S AU - Barto Andrew G TI - Reinforcement learning SN - 0-262-19398-1 U1 - 006.31 PY - 1998/// CY - Cambridge PB - MIT Press KW - Reinforcement learning(Machine learning) ER -