에이전트 시대의 AI 시스템 설계
RAG, 최적화, 가드레일로 완성하는 32가지 프로덕션 패턴
Regular price
$47.19
Sale price
Regular price
✈️
Estimated delivery date 예상 배송일
Standard Shipping
불러오는 중...
주문일로부터 8-12 영업일
Express Shipping
불러오는 중...
주문일로부터 6-8 영업일
프로토타입을 넘어 프로덕션으로!
성공적인 AI 서비스를 위한 32가지 실전 패턴
생성형 AI는 강력한 기능을 제공하지만, 이를 실제 프로덕션 환경에 안정적으로 도입하려면 환각, 비결정적 응답, 지식 공백 등 치명적인 한계를 극복해야 한다. 이 책은 현업 전문가들이 LLM 애플리케이션과 에이전트를 구축할 때 마주치는 핵심 문제를 해결하는 검증된 설계 패턴 32가지를 집대성했다. 최신 연구와 실제 현장의 경험을 바탕으로 패턴마다 명확한 문제 정의, 완전한 예제 코드, 도입 시 장단점까지 상세히 다루어 흔들리지 않는 AI 시스템 구축을 위한 명확한 실무 지침을 제공한다.
성공적인 AI 서비스를 위한 32가지 실전 패턴
생성형 AI는 강력한 기능을 제공하지만, 이를 실제 프로덕션 환경에 안정적으로 도입하려면 환각, 비결정적 응답, 지식 공백 등 치명적인 한계를 극복해야 한다. 이 책은 현업 전문가들이 LLM 애플리케이션과 에이전트를 구축할 때 마주치는 핵심 문제를 해결하는 검증된 설계 패턴 32가지를 집대성했다. 최신 연구와 실제 현장의 경험을 바탕으로 패턴마다 명확한 문제 정의, 완전한 예제 코드, 도입 시 장단점까지 상세히 다루어 흔들리지 않는 AI 시스템 구축을 위한 명확한 실무 지침을 제공한다.
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
LLM이 스스로 판단하고 행동하는 시대,
모델을 바꿔도 무너지지 않는 설계 원칙
기반 모델을 호출해 그럴듯한 AI 애플리케이션을 만드는 일은 이제 누구에게나 열려 있습니다. 하지만 이를 실제 서비스로 운영하려 할 때, 본격적인 문제가 시작됩니다. 모델이 지어낸 답이 고객에게 그대로 전달되고, 매번 달라지는 출력이 후속 파이프라인을 무너뜨리고, 에이전트가 엉뚱한 도구를 호출하는 순간, 프롬프트 수정만으로는 해결되지 않는 구조적 문제가 드러납니다. AI가 스스로 계획하고 판단하고 행동하는 시대일수록 그 행동을 떠받치는 시스템 설계의 격차가 서비스의 성패를 결정합니다.
이 책은 콘텐츠 제어, RAG 고도화, 추론 확장, 다중 에이전트 협업, 비용·지연시간 최적화, 안전 가드레일까지 7개 영역을 관통하는 32가지 설계 패턴을 담았습니다. 각 패턴은 문제 정의, 해법, 트레이드오프, 예제 코드로 구성되어 있으며 특정 모델이나 프레임워크에 종속되지 않습니다. 기술 스택이 교체되어도 유효한 설계 원칙을 손에 쥐고 싶다면 이 책이 가장 확실한 출발점이 될 것입니다.
주요 내용
● LLM의 태생적 한계를 극복하는 방법과 시스템 설계 우회법 알아보기
● 출력 콘텐츠의 특정 스타일, 어조, 데이터 형식 제어하기
● 비용, 지연시간과 같은 다양한 위험을 통제해 모델 효율성 극대화하기
● 스스로 계획하고 수정하며 외부 도구를 실행하는 자율 에이전트 구축하기
● 여러 패턴을 결합해 상용화 수준의 에이전틱 애플리케이션 완성하기
대상 독자
● 생성형 AI 기반 서비스를 설계·개발·운영하는 AI/백엔드 엔지니어
● 시스템 아키텍처와 품질을 책임지는 아키텍트나 기술 리더
● LLM과 사내 데이터를 연결해 업무 자동화를 구축하려는 데이터/ML 엔지니어
● AI 도입의 설계 방향을 판단해야 하는 PM이나 CTO
모델을 바꿔도 무너지지 않는 설계 원칙
기반 모델을 호출해 그럴듯한 AI 애플리케이션을 만드는 일은 이제 누구에게나 열려 있습니다. 하지만 이를 실제 서비스로 운영하려 할 때, 본격적인 문제가 시작됩니다. 모델이 지어낸 답이 고객에게 그대로 전달되고, 매번 달라지는 출력이 후속 파이프라인을 무너뜨리고, 에이전트가 엉뚱한 도구를 호출하는 순간, 프롬프트 수정만으로는 해결되지 않는 구조적 문제가 드러납니다. AI가 스스로 계획하고 판단하고 행동하는 시대일수록 그 행동을 떠받치는 시스템 설계의 격차가 서비스의 성패를 결정합니다.
이 책은 콘텐츠 제어, RAG 고도화, 추론 확장, 다중 에이전트 협업, 비용·지연시간 최적화, 안전 가드레일까지 7개 영역을 관통하는 32가지 설계 패턴을 담았습니다. 각 패턴은 문제 정의, 해법, 트레이드오프, 예제 코드로 구성되어 있으며 특정 모델이나 프레임워크에 종속되지 않습니다. 기술 스택이 교체되어도 유효한 설계 원칙을 손에 쥐고 싶다면 이 책이 가장 확실한 출발점이 될 것입니다.
주요 내용
● LLM의 태생적 한계를 극복하는 방법과 시스템 설계 우회법 알아보기
● 출력 콘텐츠의 특정 스타일, 어조, 데이터 형식 제어하기
● 비용, 지연시간과 같은 다양한 위험을 통제해 모델 효율성 극대화하기
● 스스로 계획하고 수정하며 외부 도구를 실행하는 자율 에이전트 구축하기
● 여러 패턴을 결합해 상용화 수준의 에이전틱 애플리케이션 완성하기
대상 독자
● 생성형 AI 기반 서비스를 설계·개발·운영하는 AI/백엔드 엔지니어
● 시스템 아키텍처와 품질을 책임지는 아키텍트나 기술 리더
● LLM과 사내 데이터를 연결해 업무 자동화를 구축하려는 데이터/ML 엔지니어
● AI 도입의 설계 방향을 판단해야 하는 PM이나 CTO
목차
목차
CHAPTER 1 서론
_1.1 생성형 AI 설계 패턴
_1.2 기초 모델에 기반한 애플리케이션 구축
_1.3 에이전트형 AI
_1.4 세밀한 제어
_1.5 컨텍스트 내 학습
_1.6 사후훈련
_1.7 이 책의 구성
CHAPTER 2 콘텐츠 스타일의 제어
_2.1 패턴 1: 로짓 마스킹
_2.2 패턴 2: 문법
_2.3 패턴 3: 스타일 전이
_2.4 패턴 4: 역중립화
_2.5 패턴 5: 콘텐츠 최적화
_2.6 요약
CHAPTER 3 지식 추가: 기본
_3.1 패턴 6: 기본 RAG
_3.2 패턴 7: 의미 기반 색인화
_3.3 패턴 8: 대규모 색인화
_3.4 요약
CHAPTER 4 지식 추가: 고급
_4.1 패턴 9: 색인 인식 검색
_4.2 패턴 10: 노드 후처리
_4.3 패턴 11: 신뢰할 수 있는 생성
_4.4 패턴 12: 심층 탐색
_4.5 요약
CHAPTER 5 모델 능력 확장
_5.1 LLM 추론의 한계
_5.2 패턴 13: 사고 연쇄(CoT)
_5.3 패턴 14: 사고 트리(ToT)
_5.4 패턴 15: 어댑터 조정
_5.5 패턴 16: 지시사항 진화
_5.6 요약
CHAPTER 6 신뢰성 개선
_6.1 패턴 17: 심판형 LLM
_6.2 패턴 18: 성찰
_6.3 패턴 19: 의존성 주입
_6.4 패턴 20: 프롬프트 최적화
_6.5 요약
CHAPTER 7 에이전트의 행동 능력 활성화
_7.1 패턴 21: 도구 호출
_7.2 패턴 22: 코드 실행
_7.3 패턴 23: 다중 에이전트 협업
_7.4 요약
CHAPTER 8 제약 조건 해결
_8.1 패턴 24: 소규모 언어 모델
_8.2 패턴 25: 프롬프트 캐싱
_8.3 패턴 26: 인퍼런스 최적화
_8.4 패턴 27: 성능 저하 테스트
_8.5 패턴 28: 장기 기억
_8.6 요약
CHAPTER 9 안전장치 설정
_9.1 패턴 29: 템플릿 생성
_9.2 패턴 30: 조립 후 재구성
_9.3 패턴 31: 자체점검
_9.4 패턴 32: 가드레일
_9.5 요약
CHAPTER 10 조합 가능한 에이전트형 작업흐름
_10.1 에이전트형 작업흐름
_10.2 요약
_1.1 생성형 AI 설계 패턴
_1.2 기초 모델에 기반한 애플리케이션 구축
_1.3 에이전트형 AI
_1.4 세밀한 제어
_1.5 컨텍스트 내 학습
_1.6 사후훈련
_1.7 이 책의 구성
CHAPTER 2 콘텐츠 스타일의 제어
_2.1 패턴 1: 로짓 마스킹
_2.2 패턴 2: 문법
_2.3 패턴 3: 스타일 전이
_2.4 패턴 4: 역중립화
_2.5 패턴 5: 콘텐츠 최적화
_2.6 요약
CHAPTER 3 지식 추가: 기본
_3.1 패턴 6: 기본 RAG
_3.2 패턴 7: 의미 기반 색인화
_3.3 패턴 8: 대규모 색인화
_3.4 요약
CHAPTER 4 지식 추가: 고급
_4.1 패턴 9: 색인 인식 검색
_4.2 패턴 10: 노드 후처리
_4.3 패턴 11: 신뢰할 수 있는 생성
_4.4 패턴 12: 심층 탐색
_4.5 요약
CHAPTER 5 모델 능력 확장
_5.1 LLM 추론의 한계
_5.2 패턴 13: 사고 연쇄(CoT)
_5.3 패턴 14: 사고 트리(ToT)
_5.4 패턴 15: 어댑터 조정
_5.5 패턴 16: 지시사항 진화
_5.6 요약
CHAPTER 6 신뢰성 개선
_6.1 패턴 17: 심판형 LLM
_6.2 패턴 18: 성찰
_6.3 패턴 19: 의존성 주입
_6.4 패턴 20: 프롬프트 최적화
_6.5 요약
CHAPTER 7 에이전트의 행동 능력 활성화
_7.1 패턴 21: 도구 호출
_7.2 패턴 22: 코드 실행
_7.3 패턴 23: 다중 에이전트 협업
_7.4 요약
CHAPTER 8 제약 조건 해결
_8.1 패턴 24: 소규모 언어 모델
_8.2 패턴 25: 프롬프트 캐싱
_8.3 패턴 26: 인퍼런스 최적화
_8.4 패턴 27: 성능 저하 테스트
_8.5 패턴 28: 장기 기억
_8.6 요약
CHAPTER 9 안전장치 설정
_9.1 패턴 29: 템플릿 생성
_9.2 패턴 30: 조립 후 재구성
_9.3 패턴 31: 자체점검
_9.4 패턴 32: 가드레일
_9.5 요약
CHAPTER 10 조합 가능한 에이전트형 작업흐름
_10.1 에이전트형 작업흐름
_10.2 요약
저자
저자
발리아파 락슈마난 (Valliappa Lakshmanan)
금융 분야의 심화 도메인 AI 에이전트를 구축하는 스타트업 오빈 AI의 공동 창업자이자 CTO다. 그전에는 구글에서 AI 솔루션 부문 디렉터로, 미국 해양대기청(NOAA)에서 머신러닝 연구원으로 일했다. 다수의 오라일리 도서를 저술했으며, 기상 이변 예측 분야에 머신러닝을 도입한 선구적인 공로를 인정받아 미국기상학회 펠로로 선출되었다.
금융 분야의 심화 도메인 AI 에이전트를 구축하는 스타트업 오빈 AI의 공동 창업자이자 CTO다. 그전에는 구글에서 AI 솔루션 부문 디렉터로, 미국 해양대기청(NOAA)에서 머신러닝 연구원으로 일했다. 다수의 오라일리 도서를 저술했으며, 기상 이변 예측 분야에 머신러닝을 도입한 선구적인 공로를 인정받아 미국기상학회 펠로로 선출되었다.
Payment & Security
Payment methods
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.

