▷ 아티클 스터디

[내일배움캠프] QA/QC 5기 - 4일차 _ 아티클 스터디 "데이터 분석이란 무엇일까?"

qc-standard 2026. 3. 12. 23:16

2026/03/12 Thu.

  • 데이터 분석 종합 3강
  • 데이터 분석 종합 4강
  • 아티클 스터디 정리
  • 도메인 관련 관의 더 찾아보기

 


⊙ 아티클 스터디

주제

: 데이터 분석이란 무엇일까?   (  http://yozm.wishket.com/magazine/detail/1567/  )

 

요약

 

핵심 개념

데이터(Date) 관찰이나 측정을 통해 수집 된 사실이나 정보의 집합 / 분석 통해 유의미한 정보로 가치가 생김
정성적 데이터  숫자가 아닌 데이터
서술형으로 기록되는  데이터
정량적 데이터 숫자 데이터
통계 분석 수행 데이터 수집, 분석, 해석하는 행위

데이터 분석 데이터 정리, 변환, 조작, 검사함으로 유의미한 결과 도출하는 작업
데이터 분석 프로세스
목표 설정 → 데이터 수집 → 데이터 정제 → 분석 → 결과 공유

데이터 분석
  • 기술적 분석 (Descriptive Analysis) : 데이터 요약 및 핵심 파악
  • 진단적 분석 (Diagnostic Analysis)  : 데이터 패턴 분석을 통한 원인 분석
  • 예측 분석 (Predictive Analysis)       : 미래 예측을 통한 인사이트 제시
  • 처방적 분석 (Prescriptive Analysis) : 모든 인사이트 취합 및 미래 계획 수립

 

용어정리

데이터 관찰이나 측정을 통해 수집된 사실이나 정보의 집합
데이터 베이스 데이터를 전자 저장소에 저장해 놓은 것
SQL Structured Query Language
관계형 데이터베이스를 조회하고 상호작용하는데 사용하는 언어
데이터 CRUD 데이터 - 생성, 읽기, 업데이트, 삭제
파이썬
  • 범용 프로그래밍 언어
  • 영어와 유사한 구조
  • 초보가 사용하기 용이
  • 대표적으로 Pandas, Numpy가 있음
  • 대표적인 시각화 라이브러리로 Matplotlib이 있음
R
  • 통계, 데이터 분석에 사용되는 프로그래밍 언어
  • 전문가 사용에 용이

 

+ 선택 : 실무 적용 사례

아티클의 내용을 바탕으로 관례 사례, 가상 시나리오를 만들어 적용해보는 스터디

도메인 의약품
가상시나리오 A라는 완제의약품 샘플링 검사 중 용출률이 기준 하한선에 근접한 결과가 나왔다.
이는 GMP 기준 부적합으로 전수 조사 및 전량 회수해야 하는 상황이 도래하였다.
(용출률 : 약물이 체내에서 녹는 속도)
1. 문제인식 A 의약품 용출률 부적합 발생
2. 데이터 수집
  • 공정 데이터 : 타정 속도, 혼합기 RPM 및 가동시간
  • 환경 데이터 : 제조실 내 온도/습도 데이터
  • 원료 데이터 : API(주성분)과 부형제 롯트 번호, Particle Size(입자 크기), 수분 함량숫자 데이터
  • 품질 데이터 : 용출 시험 결과값, 경도, 마모도 수치
3. 데이터 정제
  • 데이터 결합 : 혼합 공정과 타정 공정 발생 시간이 다르므로 동일한 배치 번호 기준으로 데이터 결합
  • 데이터 제거 : 결측치 제거
4. 분석
  • 기술적 분석 : 1년 치 평균 용출률과 공정 변수의 분포를 시각화하여 정상 용출률 범위 파악
  • 진단적 분석 : 타정기 압력과 제조실 내 온도/습도 사이의 상관 관계 분석 및 패턴 분석
    → 제조실 내 습도 50% 이상인 경우 타정기 압력이 증가해 용출률이 급격히 감소
  • 예측 분석    : 원료 상태와 작업실 습도를 바탕으로 예상 용출률 계산
  • 처방적 분석 : APC(자동 공정 제어) 가이드 라인 수립 및 습도에 따른 타정기 압력 실시간 자동 조절
5. 결과 공유
  • 데이터 시각화 : 공정 변수들 간의 관계 및 용출률 예측 대시보드 작성
  • SOP에 습도에 따른 타정기 압력 관리 기준 명시
  • 생산 관리자에게 실시간 알림 시스템 구축을 위한 설비 투자 설득
    →  폐기 비용 절감으로 인한 OEE(전체 공정 효율) 증가 예측 데이터를 근거로 제시
    → 안정적인 생산 시스템 구축 시 재현성 높은 의약품 생산 및 GMP 기준 적합률 증가 예측 데이터를 근거로 제시