내일배움캠프(QC,QA_5기)

[내일배움캠프] QA/QC 5기 - 2일차 _ 데이터분석종합 2강

qc-standard 2026. 3. 10. 21:15

2026/03/10 

  • 아티클 스터디
  • 데이터 분석 강의 2강
  • 커리어 스터디

 

⊙ 데이터 분석 종합반_2강

데이터 분석 과정

  1. 데이터 가져오기
  2. 데이터 살펴보기
  3. 데이터 다듬기 : 빈 데이터가 있는 데이터 지우기

파이썬

Colab
: 구글에서 제공하는 파이썬 데이터 분석 프로그램
: 설치가 필요 없으며
: 온라인에서 자유롭게 사용 - 구글 드라이브에 저장
: print - 명령어를 서두에 써야 명령어 입력
: Enter가 아닌 Ctrl + Enter를 해야 명령어 입력 됨

 

변수
: 데이터를 담는 컨테이너
: 상황에 따라 필요한 데이터를 쉽게 부를 수 있음
: 변수 = 값 으로 표현
: 값에는 숫자, 글자 모두 가능
: 값에 글자를 표현할 경우 ' ' 작은 따옴표 안에 작성

 

리스트
: 하나의 값에 여러개의 값에 순서가 있는 데이터 모음

 

리스트 선언

대괄호 속에 값을 넣음 / 쉼표 공백으로 나열함

 

→ 도출된 값

 

 

리스트 안에 특정 값을 불러오는 방법

*인덱스 0,1,2로 시작*

*순서는 0부터 시작*

 

 

 

 

 

 

딕셔너리
: 이름(Key)과 값(Value)가 쌍(Pair)으로 된 데이터 모음

 

 

딕셔너리 값은 {} 중괄호 사용

'이름' : 값 으로 표

 

 

 

 

 

 

Pandas 사용한 데이터 분석

Pandas에서 사용할 데이터 분석 구조

  1. 문제 정의 수립
  2. 데이터 분석 기본 설정
  3. 데이터 분석
  4. 결과 시각화
  5. 결과 도출

 

3. 상관 관계 분석

1) Pandas 사용 선언 하기

2) 데이터 가져오기

3) 데이터 확인 및 표 읽기

4) 공백란 제거하기

 

5) 데이터 분석

6) 결과 확인

 

4. Matplotlib을 사용한 결과 시각화

1) matplotlib 사용 선언 하기

2) 그래프 그리기

3) 그래프로 사용할 부분만 남기기

 그래프로 나타낼 부분 지정

필요없는 행 삭제

4) 원하는 그래프로 변경 하기

막대 그래프로 변

 

 

 

+ 한걸음 더