AI 기반 데이터 사이언스 방법론(Python을 활용한)
머신러닝부터 생성형 AI까지
Regular price
$29.21
Sale price
Regular price
✈️
Estimated delivery date 예상 배송일
Standard Shipping
불러오는 중...
주문일로부터 8-12 영업일
Express Shipping
불러오는 중...
주문일로부터 6-8 영업일
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
목차
목차
제1장 데이터 사이언스의 진화: 통계에서 AI까지
제1절 데이터 사이언스의 역사와 패러다임 변화
제2절 머신러닝의 주요 유형
제3절 AI 시대의 데이터 분석 워크플로우
제4절 LLM 기반 탐색적 데이터 분석
제5절 전통적 머신러닝 vs. 딥러닝: 선택 기준
제6절 분석 방법 총람
제2장 데이터 전처리와 특성 공학: 모델 성능을 좌우하는 원리
제1절 결측치 처리: 결측이 학습에 미치는 영향
제2절 스케일링: 입력 스케일의 역할
제3절 차원 축소: 고차원의 저주와 정보 보존
제4절 특성 공학: 모델이 학습하기 쉬운 표현 만들기
제5절 텍스트의 수치 표현: LLM 기반 변환
제6절 범주형 변수 임베딩: 관계의 수치적 표현
제3장 분류와 회귀: 전통에서 AutoML까지
제1절 분류와 회귀 문제의 기초
제2절 평가 지표의 체계적 정리
제3절 의사결정나무와 해석 가능한 ML
제4절 로지스틱 회귀와 SVM의 현대적 활용
제5절 이상치 탐지 기법
제6절 AutoML: 자동화된 모델 선택
제4장 군집 분석: 유사성 기반 데이터 분할과 비즈니스 응용
제1절 군집 분석이 해결하는 문제
제2절 K-Means: 중심점 거리 기반 유사성
제3절 HDBSCAN: 밀도 기반 유사성
제4절 임베딩 기반 군집: 의미적 유사성에 따른 텍스트 군집화
제5절 딥 클러스터링: 표현 학습과 군집의 공동 최적화
제5장 앙상블 학습: 정형 데이터 모델링과 해석
제1절 앙상블 학습의 원리
제2절 랜덤 포레스트
제3절 그래디언트 부스팅
제4절 하이퍼파라미터 최적화 전략
제5절 트리 기반 모델의 심화 해석
제6절 Counterfactual Explanations
제7절 정형 데이터 모델링: XGBoost와 딥러닝 비교
제8절 앙상블과 LLM의 결합 전략
제6장 토픽 모델링: 비정형 텍스트의 잠재 주제 추출
제1절 토픽 모델링이 해결하는 문제
제2절 LDA: 단어 빈도로 주제 추론하는 원리
제3절 BERTopic: 의미적 유사성으로 주제 발견
제4절 LLM 기반 토픽 라벨링
제5절 동적 토픽: 토픽 생명주기 분석
제6절 Multimodal Topic Modeling: 텍스트와 이미지 통합 분석
제7장 신경망 기반 데이터 분석: 표현 학습과 정형 데이터 모델링
제1절 신경망의 학습 원리
제2절 신경망이 데이터 분석에 기여하는 방식
제3절 정형 데이터 딥러닝: 트리 모델과의 비교
제4절 표현 학습: 오토인코더와 임베딩 추출
제5절 실무 파이프라인: PyTorch 기반 분석 흐름
제8장 생성 모델 기반 데이터 분석: 합성 데이터, 불확실성의 정량화
제1절 생성 모델이 데이터 분석에 기여하는 방식
제2절 합성 데이터 생성: CTGAN과 정형 데이터
제3절 VAE: 데이터 증강과 탐색 도구로서의 활용
제4절 Diffusion Model: 불확실성 정량화와 예측
제9장 시계열 분석: 미래 예측과 패턴 탐지
제1절 시계열 분석이 해결하는 문제
제2절 시계열의 구성 요소: 추세, 계절성, 잔차
제3절 ARIMA: 과거 값과 오차로 미래 예측
제4절 Prophet: 추세와 계절성의 가법 모형
제5절 LSTM: 순서를 기억하는 신경망
제6절 Transformer 시계열: Attention으로 중요한 과거 참조
제7절 TimeGPT: Foundation Model로 Zero-shot 예측
제8절 실습: 시계열 예측 모형 비교
제10장 생존 분석: 시간-사건 데이터의 모델링
제1절 생존 분석이 해결하는 문제
제2절 Kaplan-Meier 추정: 비모수적 생존 곡선과 집단 비교
제3절 Cox 비례위험 모형: 공변량이 생존에 미치는 영향 분석
제4절 머신러닝 생존 분석: 비선형 위험 패턴의 포착
제5절 딥러닝 생존 분석: DeepSurv와 경쟁 위험 모델링
제6절 경쟁 위험 분석
제7절 모형 비교 및 선택 가이드
제11장 그래프 분석: 네트워크에서 패턴 발견
제1절 그래프 분석이 해결하는 문제
제2절 중심성 분석: 영향력 있는 노드 찾기
제3절 커뮤니티 탐지: 숨겨진 그룹 발견
제4절 링크 예측: 미래 관계 예측
제5절 그래프 임베딩: 노드를 벡터로 표현
제6절 추천 시스템: 사용자-아이템 관계 분석
제12장 그래프 신경망과 지식 그래프: 딥러닝 기반 관계 분석
제1절 GNN의 분석 원리
제2절 노드 분류: 노드 속성 예측
제3절 GNN 링크 예측: 관계 예측
제4절 GNN 추천 시스템: MF에서 LightGCN으로
제5절 지식 그래프 임베딩: 관계 추론
제6절 GNN의 발전 방향과 정리
제1절 데이터 사이언스의 역사와 패러다임 변화
제2절 머신러닝의 주요 유형
제3절 AI 시대의 데이터 분석 워크플로우
제4절 LLM 기반 탐색적 데이터 분석
제5절 전통적 머신러닝 vs. 딥러닝: 선택 기준
제6절 분석 방법 총람
제2장 데이터 전처리와 특성 공학: 모델 성능을 좌우하는 원리
제1절 결측치 처리: 결측이 학습에 미치는 영향
제2절 스케일링: 입력 스케일의 역할
제3절 차원 축소: 고차원의 저주와 정보 보존
제4절 특성 공학: 모델이 학습하기 쉬운 표현 만들기
제5절 텍스트의 수치 표현: LLM 기반 변환
제6절 범주형 변수 임베딩: 관계의 수치적 표현
제3장 분류와 회귀: 전통에서 AutoML까지
제1절 분류와 회귀 문제의 기초
제2절 평가 지표의 체계적 정리
제3절 의사결정나무와 해석 가능한 ML
제4절 로지스틱 회귀와 SVM의 현대적 활용
제5절 이상치 탐지 기법
제6절 AutoML: 자동화된 모델 선택
제4장 군집 분석: 유사성 기반 데이터 분할과 비즈니스 응용
제1절 군집 분석이 해결하는 문제
제2절 K-Means: 중심점 거리 기반 유사성
제3절 HDBSCAN: 밀도 기반 유사성
제4절 임베딩 기반 군집: 의미적 유사성에 따른 텍스트 군집화
제5절 딥 클러스터링: 표현 학습과 군집의 공동 최적화
제5장 앙상블 학습: 정형 데이터 모델링과 해석
제1절 앙상블 학습의 원리
제2절 랜덤 포레스트
제3절 그래디언트 부스팅
제4절 하이퍼파라미터 최적화 전략
제5절 트리 기반 모델의 심화 해석
제6절 Counterfactual Explanations
제7절 정형 데이터 모델링: XGBoost와 딥러닝 비교
제8절 앙상블과 LLM의 결합 전략
제6장 토픽 모델링: 비정형 텍스트의 잠재 주제 추출
제1절 토픽 모델링이 해결하는 문제
제2절 LDA: 단어 빈도로 주제 추론하는 원리
제3절 BERTopic: 의미적 유사성으로 주제 발견
제4절 LLM 기반 토픽 라벨링
제5절 동적 토픽: 토픽 생명주기 분석
제6절 Multimodal Topic Modeling: 텍스트와 이미지 통합 분석
제7장 신경망 기반 데이터 분석: 표현 학습과 정형 데이터 모델링
제1절 신경망의 학습 원리
제2절 신경망이 데이터 분석에 기여하는 방식
제3절 정형 데이터 딥러닝: 트리 모델과의 비교
제4절 표현 학습: 오토인코더와 임베딩 추출
제5절 실무 파이프라인: PyTorch 기반 분석 흐름
제8장 생성 모델 기반 데이터 분석: 합성 데이터, 불확실성의 정량화
제1절 생성 모델이 데이터 분석에 기여하는 방식
제2절 합성 데이터 생성: CTGAN과 정형 데이터
제3절 VAE: 데이터 증강과 탐색 도구로서의 활용
제4절 Diffusion Model: 불확실성 정량화와 예측
제9장 시계열 분석: 미래 예측과 패턴 탐지
제1절 시계열 분석이 해결하는 문제
제2절 시계열의 구성 요소: 추세, 계절성, 잔차
제3절 ARIMA: 과거 값과 오차로 미래 예측
제4절 Prophet: 추세와 계절성의 가법 모형
제5절 LSTM: 순서를 기억하는 신경망
제6절 Transformer 시계열: Attention으로 중요한 과거 참조
제7절 TimeGPT: Foundation Model로 Zero-shot 예측
제8절 실습: 시계열 예측 모형 비교
제10장 생존 분석: 시간-사건 데이터의 모델링
제1절 생존 분석이 해결하는 문제
제2절 Kaplan-Meier 추정: 비모수적 생존 곡선과 집단 비교
제3절 Cox 비례위험 모형: 공변량이 생존에 미치는 영향 분석
제4절 머신러닝 생존 분석: 비선형 위험 패턴의 포착
제5절 딥러닝 생존 분석: DeepSurv와 경쟁 위험 모델링
제6절 경쟁 위험 분석
제7절 모형 비교 및 선택 가이드
제11장 그래프 분석: 네트워크에서 패턴 발견
제1절 그래프 분석이 해결하는 문제
제2절 중심성 분석: 영향력 있는 노드 찾기
제3절 커뮤니티 탐지: 숨겨진 그룹 발견
제4절 링크 예측: 미래 관계 예측
제5절 그래프 임베딩: 노드를 벡터로 표현
제6절 추천 시스템: 사용자-아이템 관계 분석
제12장 그래프 신경망과 지식 그래프: 딥러닝 기반 관계 분석
제1절 GNN의 분석 원리
제2절 노드 분류: 노드 속성 예측
제3절 GNN 링크 예측: 관계 예측
제4절 GNN 추천 시스템: MF에서 LightGCN으로
제5절 지식 그래프 임베딩: 관계 추론
제6절 GNN의 발전 방향과 정리
저자
저자
이석민
서울대학교에서 인류학(학부), 의회정치(석사), 과학기술정책(박사)을 수학했으며, 박사후 과정에서 통계학과 계량경제학을 연구했다. 인류학적 관찰에서 시작하여 정치학과 정책학의 이론적 토대를 거쳐, 계량경제학과 통계학의 방법론적 엄밀성을 습득한 후, 최근에는 딥러닝과 생성형 AI를 정책 현장에 적용하는 연구를 수행하고 있다. 수원대학교 행정학과에서 빅데이터분석을 연구했으며, 현재 한신대학교 공공인재빅데이터융합학부에서 AI 기반 정책분석과 딥러닝 응용 연구를 진행하고 있다. 『AI를 활용한 시니어 정신건강 진단 앱』을 개발하고 특허출원했다. 저서로는 『R과 STATA를 활용한 정책평가방법론』(2017), 『빅데이터분석방법론』, 『구조방정식: 준실험설계접근』, 『인과 데이터 사이언스(Causal Data Science): AI 시대를 위한 분석·평가 모델링의 진화』 (2026), 『LLM 시대의 인문사회과학방법론』(2026)등이 있으며, 행정학 및 이공계 학술지에 논문을 게재하였다. 웹프로그래밍, 데이터베이스, MLOps, 딥러닝 자연어 처리 및 영상처리, AI 에이전트, 정책분석평가, 분석기획론 등 인문사회과학과 AI·Software 기술을 융합하는 교육을 실천하고 있다.
Payment & Security
Payment methods
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.
$99 이상 무료 배송
3% 리워드 크레딧 적립
Secure Payment

