헬스케어 빅데이터 분석의 정석(데이터 과학)
한 권으로 끝내는 실사례에 기초한 헬스케어 빅데이터 분석 기술
보건 의료 및 보험사, 카드사, 헬스케어 IT기업 등 종사자를 위한 책으로, 헬스케어 데이터로부터 유의미한 정보를 찾아내는 데 도움을 줄 실용적인 안내서이다. 원시 데이터 수집 및 정제부터, 빅데이터 분석 및 시각화 과정의 반복과 고도화까지 상세히 소개한다. 분석 작업에 익숙하지 않아도 쉽게 따라할 수 있도록 저자가 운영하는 회사의 실제 사용자 헬스케어 빅데이터에 기초해 분석 기술을 소개하고, 이를 실습함으로써 독자들이 능숙하게 습득할 수 있도록 했다. 이 책은 누구나 빅데이터 분석을 손쉽게 수행할 수 있도록 자신감을 심어주며, 분석 역량을 한 단계 끌어올릴 것이다.
Couldn't load pickup availability
출판사 리뷰
출판사 리뷰
◆ 헬스케어와 빅데이터, AI(인공지능) 개론
◆ IPython, 주피터 노트북, VSCode 사용법
◆ 파이썬의 기본 문법
◆ NumPy 라이브러리 사용법
◆ 데이터 분석의 핵심 pandas 라이브러리 사용법
◆ 사례에 기초한 데이터 수집과 전처리
◆ DBMS로부터 분석 대상 데이터를 파일로 추출
◆ 사례에 기초한 시계열 데이터 정제 및 분석, 그룹화, 시각화
◆ 사용자 정의 함수로 데이터 분석 고도화
◆ 자동화를 위한 배치 프로그램 작성 및 크론탭, scheduler 라이브러리 사용법
◆ 간단한 웹 대시보드 제작
◈ 이 책의 대상 독자 ◈
컴퓨터공학 전공자 및 보건 의료 종사자, 카드사, 보험사 직원 등으로, 파이썬을 활용한 빅데이터 분석 경험이 풍부하지 않은 사람을 대상으로 한다. 파이썬 지식이 부족한 독자들도 쉽게 따라올 수 있도록 구성했다.
◆ 파이썬으로 빅데이터를 분석하고 싶은 입문자
◆ 시계열 데이터를 다양한 기법으로 분석, 그룹화, 시각화하기를 원하는 독자
◆ 실제 IT기업에서 빅데이터 분석 및 시각화를 어떻게 구현하는지 궁금한 독자
◆ 상업용 빅데이터 분석과 자동화 시스템 구축, 웹 대시보드를 만들고 싶은 독자
◆ 파이썬의 기초부터 pandas 라이브러리 사용법 레퍼런스가 필요한 독자
◈ 이 책의 구성 ◈
처음 책을 기획할 때에는 사례 중심으로 책을 구성하고, 파이썬 문법 및 pandas에 대해서는 간략하게 다룰 계획이었다. 그러나 책을 집필하는 과정에서 다른 서적의 pandas 내용에 대한 불만족감이 생겨, 이 책이 분석 업무를 수행할 수 있는 완결된 가이드가 되도록 NumPy와 pandas를 상세하게 다루게 됐다. 다만, matplotlib은 이번에는 포함하지 않았다. matplotlib의 사용 방법은 어렵지 않아, 다른 서적이나 인터넷 자료를 참조하면 충분할 것이다.
목차
목차
1.1 헬스케어란 무엇인가?
1.1.1 헬스케어 비용
1.1.2 헬스케어 기술의 진보와 질병
1.1.3 인간의 수명 연장과 기대
1.1.4 현대인의 고질병인 걱정과 두려움, 스트레스
1.1.5 환자 정보와 프라이버시 보호
1.2 헬스케어의 종류와 최신 기술 트렌드
1.2.1 디지털 헬스케어의 종류
1.2.2 최신 기술 트렌드 및 사례
1.3 헬스케어 기업들의 특징
1.4 헬스케어 빅데이터란 무엇인가?
1.4.1 헬스케어 빅데이터 분석의 위치
1.5 향후 전망
마치며
2장. 빅데이터 분석, 알고리듬, 머신러닝, 인공지능 개론
2.1 빅데이터 분석
2.1.1 빅데이터와 정보의 중요성
2.1.2 빅데이터 분석
2.1.3 빅데이터 분석가와 데이터 과학자
2.1.4 빅데이터 처리 과정
2.2 알고리듬
2.3 인공지능, 머신러닝, 딥러닝
2.3.1 머신러닝의 3가지 학습 방법
2.3.2 ChatGPT
향후 전망
마치며
3장. 파이썬 설치 및 환경 구축하기
3.1 파이썬 설치하기
3.2 IPython 알아보기
3.3 주피터 랩 알아보기
3.3.1 주피터 랩 설치
3.3.2 주피터 노트북의 명령 모드
3.4 VSCode를 주피터처럼 사용하기
3.5 데이터 분석용 필수 라이브러리 설치하기
3.5.1 NumPy
3.5.2 pandas
3.5.3 matplotlib
3.5.4 scikit-learn
3.5.5 statsmodels
3.6 권장 시스템
마치며
4장. 파이썬 기본 문법과 빌트인 자료형 알아보기
4.1 파이썬 문법
4.1.1 주석
4.1.2 함수
4.1.3 익명 함수: 람다 함수
4.1.4 흐름 제어문
4.2 자료형
4.2.1 리스트
4.2.2 튜플
4.2.3 딕셔너리
4.2.4 집합
마치며
5장. NumPy 알아보기
5.1 파이썬 리스트와 배열
5.2 NumPy 알아보기
5.3 ndarray(다차원 배열 객체) 다루기
5.3.1 생성하기
5.3.2 표준 데이터 타입
5.3.3 속성: 차원 수와 모양새, 데이터 타입
5.3.4 전치
5.3.5 인덱싱과 슬라이싱
5.3.6 배열 모양새 바꾸기
5.3.7 팬시 인덱싱
5.3.8 배열의 산술 연산
5.3.9 배열 합치기 및 나누기
5.3.10 조건문으로 배열 추출하기(데이터 마스킹)
5.4 유니버설 함수
5.4.1 대표적인 단항 유니버설 함수
5.4.2 대표적인 이항 유니버설 함수
5.4.3 합, 평균, 표준편차, 분산, 누적값 구하기
5.4.4 난수 생성하기
5.4.5 그 외 유니버설 함수
5.5 배열 정렬하기
5.6 배열 집합 메서드
5.7 저장하기 및 불러오기
5.8 1차원 배열로 변형하기
5.9 브로드캐스팅
5.10 구조화된 배열
5.11 그 외 유용한 함수
마치며
6장. pandas 알아보기
6.1 데이터 타입
6.2 시리즈
6.2.1 딕셔너리로부터 시리즈 생성하기
6.2.2 명시적 인덱싱과 암묵적 인덱싱
6.2.3 조건문으로 배열 추출: 마스킹
6.2.4 벡터 연산
6.2.5 그 외
6.3 데이터프레임
6.3.1 전치
6.3.2 슬라이싱
6.3.3 슬라이싱으로 역순 정렬하기
6.3.4 마스킹
6.3.5 데이터 연산하기
6.4 누락된 데이터 다루기
6.4.1 결측치 관련 메서드
6.4.2 결측치 데이터 조사하기
6.4.3 결측치 데이터 추출하기
6.4.4 결측치 집계 구하기
6.4.5 결측치를 특정값으로 채워넣기
6.4.6 결측치 데이터 처리하기
6.4.7 결측치 제거하기
6.5 Index
6.5.1 멀티(계층적)인덱스
6.5.2 인덱스로 데이터 접근하기
6.5.3 인덱스 설정 및 해제하기
6.5.4 간단한 집계 및 통계
6.6 데이터 합치기
6.6.1 concat 함수
6.6.2 append 메서드
6.6.3 insert 메서드
6.6.4 merge 함수와 메서드
6.6.5 join 메서드
6.6.6 combine 메서드
6.6.7 combine_first 메서드
6.6.8 update 메서드
6.7 집계 및 통계 구하기
6.7.1 rolling 및 expanding 메서드
6.8 groupby 메서드
6.8.1 aggregate/agg 메서드
6.8.2 filter 메서드
6.8.3 apply 메서드
6.8.4 map 메서드
6.8.5 applymap 메서드
6.8.6 transform 메서드
6.9 상관관계 및 공분산 구하기
6.9.1 corr 메서드
6.9.2 corrwith 메서드
6.9.3 cov 메서드
6.10 중복, 유일 요소 다루기
6.11 데이터 피벗과 피벗테이블 구하기
6.11.1 pivot 메서드
6.11.2 pivot_table 함수와 메서드
6.11.3 melt 메서드
6.12 문자열 다루기
6.12.1 정규표현식
6.13 query 및 eval 메서드
6.13.1 query 메서드
6.13.2 eval 메서드
6.14 시계열 데이터 다루기
6.14.1 date_range 함수
6.14.2 DatetimeIndex 만들기
6.14.3 PeriodIndex 만들기
6.14.4 TimedeltaIndex 만들기
6.14.5 리샘플링하기
6.14.6 shift 및 tshift 메서드
6.15 카테고리(범주형) 데이터 다루기
6.16 파일로부터 읽어오기 및 저장하기
6.16.1 파일로부터 읽어오기
6.16.2 파일로 저장하기
6.17 그 외 메서드와 속성
마치며
7장. 데이터 수집과 전처리하기
7.1 데이터 전처리에 앞서
7.2 데이터 수집하기
7.2.1 웹 크롤링
7.2.2 DBMS로부터 CSV 파일 만들기
7.3 데이터 전처리
7.3.1 정제하기
7.3.2 정규표현식으로 치환하기
7.3.3 열 선택해서 수정하기
마치며
8장. 사례#1-데이터를 시각화해 보기
8.1 MySQL 테이블에서 CSV 파일 추출하기
8.1.1 MySQL shell 접속하기
8.1.2 MySQL 사용자 권한 부여하기
8.1.3 쿼리 결과를 CSV 파일로 저장하기
8.2 히트맵 그래프로 시각화해 보기
8.2.1 CSV 파일 내용 살펴보기
8.2.2 시각화해 보기
8.2.3 여러 그래프를 만들어 보기
8.2.4 일부 데이터 제외한 그래프 만들어 보기
마치며
9장. 사례#2-시계열 데이터 다루기
9.1 쿼리 결과를 CSV 파일로 저장하기
9.2 시계열 데이터 시각화
9.2.1 데이터의 정제
9.2.2 활동지수 평가 함수 만들기
9.2.3 10분 단위로 그룹화하기
9.2.4 1시간 단위로 그룹화하기
9.2.5 1일 단위로 그룹화하기
9.3 1일 데이터 시각화
9.3.1 데이터 정제 및 시각화
9.3.2 그래프를 4개로 나열하기
마치며
10장. 사례#3-누적 막대그래프와 회귀 분석해 보기
10.1 CSV 파일 살펴보기
10.2 센서 29개의 한 달간 상태별 집계 데이터 시각화
10.3 특정 센서의 활동 누적 데이터 비교
10.4 주의와 낙상의 상관관계
10.5 주의와 낙상 회귀 분석해 보기
마치며
11장. 자동화 및 웹 대시보드 만들어 보기
11.1 배치 프로그램이란?
11.2 구글 파이어베이스 다루기
11.2.1 파이어베이스 실시간 DB 프로젝트 설정하기
11.2.2 분석한 데이터를 파이어베이스 실시간 DB에 업로드하기
11.3 웹 대시보드 만들기
11.3.1 자바스크립트에서 파이어베이스 연동하기
11.3.2 라인 차트 그래프 만들기
11.3.3 누적 막대그래프 만들기
11.4 자동화 시스템 구축하기
11.4.1 크론탭으로 자동화하기
11.4.2 파이썬 scheduler 라이브러리로 자동화하기
11.4.3 윈도우 작업 스케줄러로 자동화하기
마치며
저자
저자
2021년 상반기에는 헬스케어 IT 벤처기업 빅헤브솔루션㈜을 창업했으며, 한국과 일본에서 IoT기반의 헬스케어 사업을 성공적으로 진행하고 있다. 또한, 한국과 일본의 기업들을 대상으로 데이터 분석 관련 컨설팅과 강연도 전문적으로 진행하고 있다. 저자의 회사 웹사이트에서 더 많은 정보를 확인할 수 있다.
Your payment information is processed securely. We do not store credit card details nor have access to your credit card information.

