내일배움캠프(QC,QA_5기)

[내일배움캠프] QA/QC 5기 - 7일차 _ 파이썬 1강

qc-standard 2026. 3. 17. 21:06

2026/03/17 Tue.

  • 데이터 분석_파이썬 1강
  • 데이터 분석 파이썬 2강
  • 데이터 분석 복습
  • 라이브 세션 강의 

▷ 컨디션 난조로 인한 목표 미달


⊙ 데이터 분석_파이썬 1강 + 라이브 세션 강의

복습 / 파이썬 1강 / 라이브 세션

 

파이썬이란??


º 복습 : 컴퓨터에 명령을 내리기 위한 컴퓨터 전용 언어
º 데이터 분석과 머신 러닝에 중요한 프로그밍 언어가 대부분 파이썬 문법으로 이루어져 있음
º 가독성이 높아 초보자가 사용하기에 용이
º 프로그램 언어가 간결하고 직관적 → 진입 장벽이 낮음
º 실험 결과를 수시로 확인 가능  → 데이터 분석 전/시각화 전 확인에 용이

데이터 분석 패키지 pandas
데이터 시각화 패키지 matpltlib, seaborn
머신러닝 패키지 scikitlearn
딥러닝 패키지 pytorch, tensorflow
  → 데이터 분석에 있어 중요한 언어 = 파이썬

 

왜 파이썬일까?

º 가장 인기 있는 프로그래밍 언어
º 직관적으로 쉬운 프로그래밍 언어
→ JAVA(웹 개발), C언어(게임)에 비해 월등하게 쉬움
º 확장성이 좋음
→ 다양한 라이브러리 : 데이터분석, 시각화, 머신러닝, 통계 등 다양한 라이브러리
→ 다른 언어(C, C++, JAVA 등)와 연동 가능
→ 다양한 개발 분야에 활용 가능 : 게임, 웹개발, IoT 등

º 단점 : 느리다 → JAVA, C언어에 비해 느릴 수 있음

º 파이썬 개발 환경 : colab
(프로젝트용 : 파이참-국내에서 거의 사용하지 않는 추세 /  VS코드-가장 유명)
(데이터 분석 및 시각화용 : 주피터 랩-노트북에서 사용 / 코랩-인터넷되면 어디든 사용)

 

 

데이터 분석 모든 과정에서 사용

º 설명 : 데이터 불러오기/전처리/시각화/계산 등 모든 과정에 파이썬 문법 사용
º 목적 : 데이터 분석을 파이썬으로 하기 위한 문법 이해
º  결과물 : 데이터 분석의 모든 과정 수행

기대효과
1. 데이터 관리
2. 데이터 전처리
3. 데이터 시각화
4. 데이터 계산

AI 모델(머신러닝, 딥러닝)을 사용할 때 파이썬 문법 필요

 

 

파이썬을 다룰 수 있는 다양한 개발 환경

Jupyter Notebook Colabaratory(Colab) Visual Studio PyCharm
º  데이터 과학 및 프로그래밍 작업을 위한 개발 환경
º  데이터 분석 및 시각화를 하기에 용이
º  주로 파이썬이나 R과 같은 언어로 코드를 작성하고 실행
º  Anaconda를 설치하여 어렵지 않게 Jupyter Notebook을 설치할 수 있음
º  편리한 파이썬 개발 환경
º  구글에서 제공하는 클라우드 기반의 Jupyter Notebook 환경

º  기본적으로는 Jupyter Notebook과 닮았는데 구글의 클라우드에 설치된 파이썬을 손쉽게 사용 →  따로 프로그램을 설치 하지 않아도 고사양의 환경에서 파이썬을 작동 가능
º  Microsoft에서 개발한 통합 개발 환경도 파이썬을 코딩할 때 사용 가능
º  파이썬 언어 말고도 다양한 프로그래밍 언어를 사용
º  편리한 기능 제공하기에 프로그래밍을 많이 하시는 분들은 자주 사용
º  JetBrains에서 개발한 Python 프로그래밍 언어를 위한 통합 개발 환경

º 국내에서 거의 사용하지 않는 추세
설치 환경   설치환경 설치환경

 

 

Colab 단축키

코드 실행: 코드 셀을 실행하려면 를 누릅니다.  Shift + Enter
Ctrl + Enter
새 코드 셀 추가: 코드 셀을 추가하려면 코드 셀 위에서 를 누릅니다. Ctrl + M + A (Windows 및 Linux)
또는 Command + M + A (Mac)
코드 셀 삭제: 코드 셀을 삭제하려면 코드 셀 위에서 를 누릅니다.
Ctrl + M + D (Windows 및 Linux)
또는 Command + M + D (Mac)
코드 셀 이전으로 되돌리기 Ctrl + M + Z
코드 셀 분할: 코드 셀을 분할하려면 코드 셀 위에서
Ctrl + M + 하이픈(-) (Windows 및 Linux)
또는 Command + M + 하이픈(-) (Mac)
셀 유형 변경: 코드 셀을 마크다운 셀로 변경하려면 코드 셀 위에서
셀 중간에 설명을 넣고 싶을 때 markdown
Ctrl + M + M (Windows 및 Linux)
또는 Command + M + M (Mac)

 

 

출력문

: 코드상의 어떤 결과물을 출력해 사람이 직접 결과물을 볼수 있도록 해주는 문법
: 가장 쉽고 기본적인 문법
: print () - ()안에 출력하고자 하는 값을 넣는다
: 여러 개의 값 출력시 ()안에서 ,쉼표로 구분

 

 

변수

: 데이터를 담는 컨테이너/바구니
: 변수 = 값 으로 표현 - 변수에 값을 담는다 - 파이썬에서 =은 담는다는 뜻
: 특정값을 저장하는 기호

: 값에는 숫자, 글자 모두 가능
: 값에 글자를 표현할 경우 ' ' 작은 따옴표 안에 작성

 

 

  • 변수는 값을 저장하는 공간으로,용하기 전에 선언되어야 합니다.
  • 변수를 선언할 때에는 변수명을 지정하고(본인이 짓고 싶은 이름 아무거나로 지으면 되요!), 할당 연산자(=)를 사용하여 값을 할당합니다.

 

 

자료형(Data Type)

: 모든 프로그래밍 언어를 다룰 때 처음 정의하는 것 중 하나

: 변수 하나의 값이 어떤 종류인지 나타냄

: 정수(int), 실수(float), 문자열(str), 리스트(list), 튜플(tuple), 딕셔너리(dict) 등

 

Numeric Type

- intergers : 정수 : 소수점으로 이루어진 숫자/딱 떨이지지 않는 숫자들

- floats : 실수 : 소수점이 아닌 숫자/딱 떨어지는 숫자 

 

리스트 : 대괄호 []

string : 따옴표 ' ' 쌍따옴표 " "

Dictionary : 중괄호와 콜론 { : }

 

문자열은 따옴표/쌍따옴표로 감싸서 선언

문자열 연산 + 이용해서 연결 가능

 

 

 

 

CRUD

데이터 조작의 네가지 기본 연산
- C: Create(생성) 데이터를 추가하거나 새롭게 생성하는 작업
- R: Read(읽기) 데이터를 조회하거나 접근하는 작업
- U: Update(수정) 기존 데이터를 변경하거나 업데이트하는 작업
- D: Delete(삭제) 데이터를 삭제하거나 제거하는 작업

 

 

인덱스

: 자료형을 구성하는 순번

: 인덱스 값의 위치

: 0,1,2,3....순이며 마지막 인덱스 값은  -1

: 인덱스 슬라이싱을 이용해 필요한 자료 추출할 수 있음 → nums[0,2] - [인덱스값=위치, 필요한 갯수+1??]

 

 

사칙연산

연산자 설명 수식예시(단, a>b) 결과(a=10, b=3)
+ 덧셈 a + b 13
- 뺄셈 a - b 7
* 곱셈 a * b 30
/ 나눗셈 a / b 3.333.....
// 몫(정수 나눗셈) a // b 3
% 나머지 a % b 1
ex) 7/2 = 3(나머지 1)
num 7 // num 2 하면 결과 3
num 7 % num 2 하면 결과 1
num 7 / num 2 하면 결과 3.xxxx

% : num 1이 num 2의 배수인지 아닌지 확인 할 수 있음
** 거듭제곱 a ** b 1000

 

abs_result = abs(num3) # 절댓값 계산

round_result = round(num3) # 반올림 계산

 

 

 

불리언(Boolean)

: 자료형 조건이 참(True) 또는 거짓(False)을 나타내는데 사용

: 자료형 조건식을 평가하는데 매우 중요

: 분석에도 자주 활용

 

 

 

결측값(NaN = Not a Number)

: missing value를 나타내는 특수한 값

: 주로 수치형 데이터에서 발생

: 데이터 정제 및 전처리 과정에서 다루어진다

: 정의할 수 없는 수치값 → 0으로 나누는 연산이나 유효하지 않은 수학적 연산 결과를 나타낼 때

 

 

 

입력문 (input)

 

  • 사용자가 숫자를 입력하면 input() 함수로 문자열 형태로 입력을 받습니다.
  • 이후 int() 함수를 사용하여 문자열을 정수로 변환하고, 두 숫자를 더하여 합을 구한 후 화면에 출력합니다.