Physical AI로 떠나는 강화학습 첫걸음(2판)
Regular price
$32.58
Sale price
Regular price
✈️
Estimated delivery date 예상 배송일
Standard Shipping
불러오는 중...
주문일로부터 8-12 영업일
Express Shipping
불러오는 중...
주문일로부터 6-8 영업일
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
목차
목차
CHAPTER 1. 강화학습 둘러보기
1.1 강화학습의 목적
1.2 강화학습의 요소
1.3 강화학습의 순차적 과정
1.4 강화학습의 학습방법 차별성
CHAPTER 2. 강화학습 모델링
2.1 MDP 환경 모델링
2.2 MDP의 강화학습 모델링
2.3 강화학습 문제 분류
2.4 요약 및 정리
CHAPTER 3. Bellman 방정식
3.1 Bellman 기대 방정식
3.2 Bellman 최적 방정식
3.3 요약 및 정리
CHAPTER 4. 환경을 알 때 강화학습 : Planning
4.1 Model 기반 강화학습
4.2 반복적 정책 평가(Iterative Policy Evalution)
4.3 정책 반복(Policy Iteration)
4.4 가치 반복(Value Iteration)
4.5 요약 및 정리
CHAPTER 5. 환경을 모를 때 강화학습 I : Prediction
5.1 Monte Carlo(MC) 방법
5.2 MC 기반 에피소드 학습
5.3 Model-Free Prediction
5.4 Prediction 기법 분석
5.5 요약 및 정리
CHAPTER 6. 환경을 모를 때 강화학습 II : Control
6.1 Action-value 함수를 활용한 Learning
6.2 Control
6.3 Control 알고리즘
6.4 자율 주행 로봇의 경로 찾기
6.5 Python Code: Gridworld
6.5 요약 및 정리
CHAPTER 7. 환경 근사화
7.1 환경 근사화 필요성
7.2 환경 근사화 함수
7.3 신경망(Neural Network)
CHAPTER 8. Value 기반 강화학습
8.1 Agent 분류
8.2 Value Network 학습
8.3 Deep Q-Network(DQN)
8.4 Python Code : Cartpole
8.5 요약 및 정리
CHAPTER 9. Policy 기반 강화학습
9.1 Deterministic policy와 stochastic policy
9.2 Policy Network 학습
9.3 Actor-Critic
9.4 Python Code 구현 : Cartpole
9.5 요약 및 정리
1.1 강화학습의 목적
1.2 강화학습의 요소
1.3 강화학습의 순차적 과정
1.4 강화학습의 학습방법 차별성
CHAPTER 2. 강화학습 모델링
2.1 MDP 환경 모델링
2.2 MDP의 강화학습 모델링
2.3 강화학습 문제 분류
2.4 요약 및 정리
CHAPTER 3. Bellman 방정식
3.1 Bellman 기대 방정식
3.2 Bellman 최적 방정식
3.3 요약 및 정리
CHAPTER 4. 환경을 알 때 강화학습 : Planning
4.1 Model 기반 강화학습
4.2 반복적 정책 평가(Iterative Policy Evalution)
4.3 정책 반복(Policy Iteration)
4.4 가치 반복(Value Iteration)
4.5 요약 및 정리
CHAPTER 5. 환경을 모를 때 강화학습 I : Prediction
5.1 Monte Carlo(MC) 방법
5.2 MC 기반 에피소드 학습
5.3 Model-Free Prediction
5.4 Prediction 기법 분석
5.5 요약 및 정리
CHAPTER 6. 환경을 모를 때 강화학습 II : Control
6.1 Action-value 함수를 활용한 Learning
6.2 Control
6.3 Control 알고리즘
6.4 자율 주행 로봇의 경로 찾기
6.5 Python Code: Gridworld
6.5 요약 및 정리
CHAPTER 7. 환경 근사화
7.1 환경 근사화 필요성
7.2 환경 근사화 함수
7.3 신경망(Neural Network)
CHAPTER 8. Value 기반 강화학습
8.1 Agent 분류
8.2 Value Network 학습
8.3 Deep Q-Network(DQN)
8.4 Python Code : Cartpole
8.5 요약 및 정리
CHAPTER 9. Policy 기반 강화학습
9.1 Deterministic policy와 stochastic policy
9.2 Policy Network 학습
9.3 Actor-Critic
9.4 Python Code 구현 : Cartpole
9.5 요약 및 정리
저자
저자
김원하
Payment & Security
Payment methods
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.
$99 이상 무료 배송
3% 리워드 크레딧 적립
Secure Payment

