Richard S. Sutton

Richard S. Sutton (* in Ohio) ist ein US-amerikanischer Informatiker.

Leben[Bearbeiten | Quelltext bearbeiten]

Sutton studierte Psychologie an der Stanford University mit dem Bachelor-Abschluss 1978 und Informatik an der University of Massachusetts at Amherst mit dem Master-Abschluss 1980 und der Promotion 1984 bei Andrew Barto (Temporal Credit Assignment in Reinforcement Learning).^[1] Danach war er bis 1995 bei GTE Laboratories, wechselte wieder an die University of Massachusetts at Amherst und war ab 1998 bei den ATT Shannon Laboratories. Ab 2003 war er Professor an der University of Alberta, wo er das Reinforcement Learning and Artificial Intelligence Laboratory (RLAI) leitet. Seit 2017 leitet er auch eine Zweigstelle von Google DeepMind in Alberta.

Er entwickelte den TD-Lambda-Algorithmus für Temporal Difference Learning, der zum Beispiel von Gerald Tesauro für sein Backgammon-Programm (TD-Gammon) benutzt wurde. Mit Barto schrieb er ein Standardwerk über Bestärkendes Lernen.

2001 wurde er Fellow der AAAI. Ausweislich seiner persönlichen Website (2017) unterstützt er die Kampagne Boycott, Divestment and Sanctions, BDS, gegen Israel.

2021 wurde Sutton in die Royal Society gewählt und erhielt den IJCAI Award for Research Excellence. Er ist Mitglied der Royal Society of Canada.

Zu seinen Doktoranden zählt David Silver.

Schriften (Auswahl)[Bearbeiten | Quelltext bearbeiten]

mit A. Barto: Toward a modern theory of adaptive networks: Expectation and prediction, Psychological Review, Band 88, 1981, S. 135
mit A. Barto, C. W. Anderson: Neuronlike adaptive elements that can solve difficult learning control problems, IEEE transactions on systems, man, and cybernetics, 1983, S. 834–846
Learning to predict by the methods of temporal differences, in: Machine Learning, Band 3, 1988, S. 9–44
mit A. Barto: Time Derivative Models of Pavlovian Reinforcement, in: Learning and Computational Neuroscience: Foundations of Adaptive Networks, 1990, S. 497–537.
Herausgeber mit W. T. Miller, P. J. Werbos: Neural Networks for Control, MIT Press 1991
mit D. Precup, S. Singh: Between MDPs and semi-MDPs: A framework for temporal abstraction in reinforcement learning, Artificial intelligence, Band 112, 1999, S. 181–211
mit A. Barto: Reinforcement Learning. An Introduction, MIT Press 1998

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

↑ Richard S. Sutton im Mathematics Genealogy Project (englisch)

Personendaten
NAME	Sutton, Richard S.
KURZBESCHREIBUNG	US-amerikanischer Informatiker
GEBURTSDATUM	vor 1978
GEBURTSORT	Ohio

[1] Richard S. Sutton im Mathematics Genealogy Project (englisch)

[1]

Richard S. Sutton

Inhaltsverzeichnis

Leben[Bearbeiten | Quelltext bearbeiten]

Schriften (Auswahl)[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Richard S. Sutton

Leben[Bearbeiten | Quelltext bearbeiten]

Schriften (Auswahl)[Bearbeiten | Quelltext bearbeiten]

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

Navigationsmenü

Suche