TASK	DATASET	MODEL	METRIC NAME	METRIC VALUE	GLOBAL RANK
Atari Games	Atari 2600 Beam Rider	MAC	Score	6072	# 38
Atari Games	Atari 2600 Breakout	MAC	Score	372.7	# 30
Atari Games	Atari 2600 Pong	MAC	Score	10.6	# 47
Atari Games	Atari 2600 Q*Bert	MAC	Score	243.4	# 54
Atari Games	Atari 2600 Seaquest	MAC	Score	1703.4	# 43
Atari Games	Atari 2600 Space Invaders	MAC	Score	1173.1	# 43
Continuous Control	Cart Pole (OpenAI Gym)	MAC	Score	178.3	# 1
Continuous Control	Lunar Lander (OpenAI Gym)	MAC	Score	163.5	# 5

Badge	Markdown
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mean-actor-critic/continuous-control-on-cart-pole-openai-gym)](https://paperswithcode.com/sota/continuous-control-on-cart-pole-openai-gym?p=mean-actor-critic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mean-actor-critic/continuous-control-on-lunar-lander-openai-gym)](https://paperswithcode.com/sota/continuous-control-on-lunar-lander-openai-gym?p=mean-actor-critic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mean-actor-critic/atari-games-on-atari-2600-breakout)](https://paperswithcode.com/sota/atari-games-on-atari-2600-breakout?p=mean-actor-critic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mean-actor-critic/atari-games-on-atari-2600-beam-rider)](https://paperswithcode.com/sota/atari-games-on-atari-2600-beam-rider?p=mean-actor-critic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mean-actor-critic/atari-games-on-atari-2600-seaquest)](https://paperswithcode.com/sota/atari-games-on-atari-2600-seaquest?p=mean-actor-critic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mean-actor-critic/atari-games-on-atari-2600-space-invaders)](https://paperswithcode.com/sota/atari-games-on-atari-2600-space-invaders?p=mean-actor-critic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mean-actor-critic/atari-games-on-atari-2600-pong)](https://paperswithcode.com/sota/atari-games-on-atari-2600-pong?p=mean-actor-critic)`
	`[![PWC](https://img.shields.io/endpoint.svg?url=https://paperswithcode.com/badge/mean-actor-critic/atari-games-on-atari-2600-qbert)](https://paperswithcode.com/sota/atari-games-on-atari-2600-qbert?p=mean-actor-critic)`

Mean Actor Critic

1 Sep 2017 · Cameron Allen, Kavosh Asadi, Melrose Roderick, Abdel-rahman Mohamed, George Konidaris, Michael Littman ·

We propose a new algorithm, Mean Actor-Critic (MAC), for discrete-action continuous-state reinforcement learning. MAC is a policy gradient algorithm that uses the agent's explicit representation of all action values to estimate the gradient of the policy, rather than using only the actions that were actually executed. We prove that this approach reduces variance in the policy gradient estimate relative to traditional actor-critic methods. We show empirical results on two control domains and on six Atari games, where MAC is competitive with state-of-the-art policy search algorithms.

PDF Abstract

Code

Add Remove Mark official

kavosh8/MAC

camall3n/atari-MAC

Tasks

Add Remove

Atari Games

reinforcement-learning

Reinforcement Learning (RL)

Datasets

OpenAI Gym

Arcade Learning Environment

Results from the Paper

Edit

Ranked #1 on Continuous Control on Cart Pole (OpenAI Gym)

Get a GitHub badge

Task	Dataset	Model	Metric Name	Metric Value	Global Rank	Benchmark
Atari Games	Atari 2600 Beam Rider	MAC	Score	6072	# 38	Compare
Atari Games	Atari 2600 Breakout	MAC	Score	372.7	# 30	Compare
Atari Games	Atari 2600 Pong	MAC	Score	10.6	# 47	Compare
Atari Games	Atari 2600 Q*Bert	MAC	Score	243.4	# 54	Compare
Atari Games	Atari 2600 Seaquest	MAC	Score	1703.4	# 43	Compare
Atari Games	Atari 2600 Space Invaders	MAC	Score	1173.1	# 43	Compare
Continuous Control	Cart Pole (OpenAI Gym)	MAC	Score	178.3	# 1	Compare
Continuous Control	Lunar Lander (OpenAI Gym)	MAC	Score	163.5	# 5	Compare

Methods

Add Remove

No methods listed for this paper. Add relevant methods here

Edit Social Preview

Mean Actor Critic

Code Edit Add Remove Mark official

Tasks Edit Add Remove

Datasets Edit

Results from the Paper Edit

Methods Edit Add Remove

Code

Add Remove Mark official

Tasks

Add Remove

Datasets

Results from the Paper

Edit

Methods

Add Remove