해법코드로 설명한 심층강화학습
반복 강화학습,정책 그라디언트,TRPO
▶ 이 책은 컴퓨터공학/과학개론을 다룬 이론서입니다. 컴퓨터공학/과학개론의 기초적이고 전반적인 내용을 학습할 수 있습니다.
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
목차
목차
제2장 OpenAI Gym
제3장 파이토치와 함께 배우는 딥러닝
제4장 크로스 엔트로피 방법
제5장 테이블 학습과 벨만 방정식
제6장 DQN: 심층 Q-신경망
제7장 DQN 확장
제8장 강화학습을 이용한 주식거래
제9장 정책 그라디언트: 다른 접근 방법
제10장 Actor-Critic
제11장 비동기 어드밴티지 Actor-Critic
제12장 강화학습으로 챗봇 학습하기
제13장 웹 탐색
제14장 연속 행동 공간
제15장 신뢰 영역 방법들 - TRPO, PPO, and ACKTR
제16장 강화학습에서의 블랙 박스 최적화
제17장 모델 프리(Model-free)를 넘어서
제18장 알파고 제로
저자
저자
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.

