Implementation of PPO (Proximal Policy Optimization)

This is a tensorflow implementation of proximal policy optimization (PPO) algorithm for continuous action

Original Paper

For Training Run:

$ python3 trainer.py

For Demo Run:

$ python3 play.py

Reference Project