1장 | 데이터 분석 개요 1-1 데이터 분석 이해 데이터 분석 정의 데이터 분석 필요성 1-2 데이터 분석 활용 분야 국외 활용 사례 국내 활용 사례 1-3 데이터 분석 도구 데이터 분석 도구 종류 데이터 분석 도구로써의 파이썬 1-4 데이터 분석 처리 과정 문제 해결의 목적 정의 데이터 수집 데이터 전처리와 정형화 데이터 탐색과 분석 활용을 위한 공유 및 평가
<둘째 마당> 파이썬 기초
2장 | 데이터 분석을 위한 실습 환경 2-1 파이썬 IDLE 파이썬 IDLE 기본 사용법 2-2 주피터 노트북 주피터 노트북 기본 사용법 2-3 구글 코랩 구글 코랩 기본 사용법
3장 | 데이터 분석을 위한 파이썬 핵심 문법 3-1 변수 변수의 개념 변수의 특징 변수를 사용하는 이유 변수 생성 및 규칙 다양한 타입의 변수 3-2 연산자 산술 연산자 대입 연산자 비교 연산자 논리 연산자 문자열 연산자 3-3 표준 입력과 출력 표준 입력 표준 출력 3-4 컬렉션 자료형 컬렉션 자료형 개념과 필요성 리스트 자료형 튜플 자료형 딕셔너리 자료형 세트(set) 자료형 3-5 리스트 내포 리스트 내포 처리 과정 3-6 선택문 파이썬 선택문 개요 if/if~else 문 if~elif/if~elif~else 문 3-7 반복문과 기타 제어문 파이썬 반복문 개요 for 문 while 문 기타 제어문 중첩 반복문 3-8 함수 함수란? 사용자 정의 함수 람다 함수 3-9 파일 입·출력 파일 입·출력 기본 세션 저장소에 업로드 텍스트 파일 읽고 쓰기 파일 오류 처리 엑셀 파일 읽고 쓰기
<셋째 마당> 데이터 분석 라이브러리
4장 | 수치 연산이 쉬운 넘파이 4-1 넘파이 배열의 개념 및 특징 4-2 넘파이 배열 생성 리스트로 배열 생성하기 배열 생성 및 초기화 생성한 값으로 배열 생성 난수 기반으로 배열 생성하기 4-3 넘파이 배열 조회 넘파이 표준 데이터 타입 넘파이 배열 속성 정보 배열의 인덱싱 배열의 슬라이싱 논리 인덱싱 4-4 배열의 연산 배열의 일반 연산 브로드캐스팅 연산 백터 연산 4-5 배열 변환 전치 배열 형태 변경 배열 요소 추가 및 삭제 배열 결합 배열 분리
5장 | 데이터 처리가 쉬운 판다스 5-1 판다스 개념 및 특징 5-2 판다스 객체 생성 Series와 DataFrame Series 만들기 DataFrame 만들기 csv 활용하기 5-3 판다스 데이터 확인하기 5-4 판다스 데이터 선택하기 5-5 판다스 결측데이터 처리하기 5-6 판다스 데이터 가공하기 5-7 판다스 데이터 그룹핑하기
6장 | 판다스 활용 6-1 붓꽃 데이터 분석하기 데이터 읽어 와서 확인하기 데이터 전처리 데이터 그룹핑하기 판다스의 데이터 시각화 6-2 타이타닉 데이터 분석하기 데이터 읽어와서 확인하기 데이터 전처리 데이터 그룹핑하기 판다스의 데이터 시각화
7장 | 시각화 라이브러리 데이터 시각화 장점 7-1 데이터 시각화 이해 데이터 시각화 활용 사례 파이썬으로 하는 데이터 시각화 시각화 옵션 7-2 맷플롯립 라이브러리 선 그래프 막대 그래프 산점도 그래프 히스토그램 그래프 상자수염 그래프 7-3 시본 라이브러리 데이터 시각화 준비하기 시본 막대 그래프 시본 산점도 그래프 시본 히스토그램 시본 상자수염 그래프 카운트 플롯 그래프 바이올린 플롯 그래프 시본 히트맵 그래프 다중 플롯 그리드 그래프
<넷째 마당> 데이터 분석 미니 프로젝트
8장 | 환경 관련 데이터 분석하기 8-1 분석 대상 데이터 수집 에어코리아 사이트에서 미세먼지 데이터 수집 기상청 사이트에서 날씨 데이터 수집 구글 코랩에 업로드하기 8-2 데이터 확인하기 미세먼지 데이터 날씨 데이터 8-3 데이터 병합하기 8-4 데이터 분석 및 시각화 데이터 분석 데이터 시각화
9장 | 행복지수 데이터 분석하기 9-1 분석 대상 데이터 수집 대한민국 행복지도 사이트에서 수집 세션 저장소에 업로드 9-2 데이터 가공 데이터 읽어와서 확인하기 데이터 병합하기 데이터 검산하기 9-3 데이터 분석 및 시각화 데이터 분석 한글 폰트 설정 선 그래프로 시각화 막대 그래프로 시각화 히트맵 그래프로 시각화
10장 | 병원 노쇼 환자 데이터 분석하기 10-1 데이터 전처리의 이해 데이터 전처리가 필요한 이유 데이터 전처리 방법 10-2 병원 노쇼 환자 데이터 분석 실습 (1) 문제 정의와 변수 설명 데이터 읽기와 확인 결측치 확인하기 통계량을 이용하여 이상치 제거하기 데이터 타입 변환 새로운 변수 추가 값 확인하여 이상치 제거하기 목적에 적합한 변수 추출 노쇼의 특징 파악 정리 10-3 병원 노쇼 환자 데이터 분석 실습 (2)
11장 | 주식 시세 예측 분석하기 11-1 시계열 데이터의 이해 시계열 데이터 패턴 시계열 데이터 분석의 이해 시계열 데이터 전처리 방법 11-2 시계열 데이터 전처리 실습 문제 정의와 변수 설명 주식 관련 라이브러리 설치하기 애플 주식 데이터 가져오기 주식 가격 시각화하기 시계열 데이터 전처리 및 데이터 확인 11-3 시계열 데이터 예측 분석 ARIMA 모델 만들기 모델을 이용하여 예측하기 예측 결과 시각화하기
12장 | 영화 리뷰 시각화하기 12-1 자연어 단어 토큰화 토큰화 실습 12-2 워드클라우드 라이브러리 설치하기 한글 글꼴 설치 텍스트 가져와서 품사 태깅하기 동일한 단어의 빈도수 구하기 워드클라우드 생성 맷플롯립으로 시각화하기 12-3 자연어 처리 실습 (1) 영화 리뷰 자연어 처리 (1) 12-4 자연어 처리 실습 (2) 영화 리뷰 자연어 처리 (2)
13장 | 대학생 정신 건강 데이터 분석하기 13-1 문제 정의와 데이터 살펴보기 데이터 읽기와 필요한 라이브러리 불러오기 13-2 데이터 전처리 속성 탐색과 전처리 데이터 시각화 상관 관계 분석하기