Interactive Reward Shaping

The code for the paper ``Iterative Reward Shaping using Human Feedback for Correcting Reward Misspecification''.

Installation

conda create -n irs python=3.7  
conda activate irs  
pip install -r requirements.txt

python main.py --task gridworld  

python main.py --task highway  

python main.py --task inventory

Name		Name	Last commit message	Last commit date
Latest commit History 117 Commits
config		config
eval		eval
src		src
trained_models		trained_models
.gitignore		.gitignore
README.md		README.md
main.py		main.py
overview.md		overview.md
requirements.txt		requirements.txt