Нужен по моему примерному ТЗ рабочий код на Python для обучения нейронной сети с подкреплением. Простой, функциональный, без излишеств. С подробными, но без фанатизма, комментариями на русском языке. =))
Цель - разобраться как это работает и что при этом используется.