2026/03/20 Fri
코드타카 4,5번 풀기- 파이썬 5강
파이썬 개인 과제 구상아티클 스터디TIL
⊙ 아티클 스터디
주제 : 데이터 리터러시 올리는 방법 ( https://yozm.wishket.com/magazine/detail/1632/ )
요약
'데이터 리터러시'를 활용해 데이터/실험 기반 사고방식, 데이터 기반 업무 방식으로 바꾼 화@ 기업 사례를 보여준다
'데이터 리터러시'를 높이려면 단순히 데이터 공유에서 그치지 않고 데이터를 올바른 관점으로 바라보고,
그 올바른 관점을 유지, 강화하기 위한 환경이 필수적이다.
주요포인트 및 핵심개념
- 데이터 리터러시
: 데이터를 활용해 문제를 해결 할 수 있는 능력
: 데이터 안 정보를 이해하고 해석하고 목적에 맞게 활용하는 능력
- 데이터 / 실험 기반 사고방식을 위한 실험 프로세스
: 문제정의 → 전사목표 align 여부 → 문제와 지표간의 align 여부, 측정 가능 여부 → 성공 여부 판단 기준 → 의미없는 액션 여부 → 검증 기준을 토대로한 결과 도출 여부 → 인사이트
▶ 이를 바탕으로 가시화 하는 것 까지
- 데이터 맵
: 데이터를 지도처럼 분류하여 쉽게 검색할 수 있도록 해놓은 것
: 분석가의 도움 없이 중요 인풋 지표, 아웃풋 비표 간의 관계도 제작, 공유가 중요
: 중요 인풋 지표을 1) 측정 가능 여부 2) 직접 control 가능 여부 의 기준에 놓고 설정하는 것이 중요
: 지표 간의 관계성 및 본인이 해결해야할 문제와 연관 여부를 빠르게 파악할 수 있도록 설계해야 함
- 대시보드
: 주요 측정치, 성과 등을 보여주는 차트, 그래프
: 흐름에 따른 지표의 현재 수준을 확인 할 수 있는 대시보드 필요
: 분석 흐름을 따라가며 지표를 탐색할 수 있도록 설계
: KPI 대시보드에서 최상위 문제 발견 시, 각 지표와 관련 하위 지표들이 구성된 대시보드에서 원인을 짐작할 수 있도록 설계
: 모든 구성원들이 중요 지표 변동과 원인 파악 분석을 스스로, 빠르게 할 수 있도록 설계
- 데이터 분석가
: 문제 정의 - 원인 분석 - 액션 아이템을 도출한 리포트 - 해당 협업팀에 리포트 제공 - 협업팀이 실행에 옮길수 있도록 요구
: 단순히 리포트에서 끝나는 업무가 아닌 실행에 옮길 수 있도록 해야 함
- 데이터 플랫폼
- 데이터 레이크
: 모든 데이터가 저장된 곳
-데이터 웨어하우스
: 신속하게 정확한 데이터를 추출할 수 있도록 구조화된 것
: 분석가들이 실질적인 업무를 빠르게 수행 할수 있도록 도와줌
: 분석에 실질적 도움을 제공하고 그로 인한 조직 성장에 기여
- 데이터 카탈로그
: 데이터 레이크/웨어하우스 내의 데이터를 쉽게 확인할 수 있도록 만들어주는 것
- 데이터 리터러시만 가지고 있다고 되는 것이 아니라
데이터를 올바른 관점에서 보고
올바른 관점을 유지, 강화할 수 있도록 환경, 노력이 필요하다
용어정리
| 전사 목표 | - 기업집단이 도달하고자 하는 궁긍적인 방향성이자 목표 - align의 기준점 |
| align(얼라인) | - 정렬 - 문제나 목표와 일치하도록 연결 - 방향성 일치 |
| OKR | - Objectives and Key Results = 목표와 핵심결과 - 목표를 바탕으로 핵심결과를 도출하기 이한 목표 설정 프레임 -성장 지향 도구 |
| KR | - Key Results = 핵심 결과 |
| KPI | - Key Performance Indicator = 핵심 성과 지표 - 최상위 측정치 |
| job bescription | - 직무 기술서 - 직무 정의, 역할, 책임까지 명시된 문서 |
| SQL | - Structured Query Language - 데이터 추출, 조작에 필요한 프로그래밍 언어 |
| 데이터 웨어하우스 | - 데이터 창고 |
+ (선택) 실무 적용 사례 (도메인_제약)
| ◎ 실무 적용 | |
| 데이터 맵 기반 품질관리 |
CQA & CPP 연관성 : 지표 간 관계 도식화 - QbD(Quality by Design, 기획 기반 품질관리) : 완제품 '용출률'이 낮을 때, 단순 재시험이 아닌 데이터 맵을 보고 '원료 입자 크기'나 '타정 압력' 데이터를 추적하여 선제적 원인 파악 |
| 실험 기반 사고 방식 | : 새로운 분석법 도입 시, DOE(Design of Experiments, 실험계획법)을 사용하여 다양한 변수를 데이터화하고 최적의 분석 조건을 찾음 |
| ◎ 가상 시나리오 | |
| 가상 시나리오 | 최근 생산된 무균 점안제 5개 배치(Batch)에서 불용성 미립자(10μm 이상) 시험 결과가 기준치(액당 6,000개 이하) 이내인 4,500~5,200개로 검출되었습니다. 과거 평균인 1,000~1,500개에 비해 급격히 상승한 OOT(Out of Trend) 상황 |
| 실험 프로세스 -문제 정의 및 데이터 기반 사고 |
- 문제: 기준(Spec) 이내이나 과거 데이터 대비 불순물 수치가 유의미하게 상승 - 목표: OOS(기준 일탈) 발생 전 원인을 파악하여 배치를 폐기하는 손실(Cost)을 방지 |
| 데이터 맵을 통한 인풋 지표 탐색 |
- 데이터 리터러시 역량을 발휘하여 데이터 웨어하우스에서 관련 지표를 호출 - 1) 설비 데이터: 충전기 노즐 교체 주기 및 마찰 부위 정비 이력 호출 - 2) 환경 데이터(BMS): 충전실(Grade A) 내의 부유 입자(Airborne Particle) 카운트 데이터 호출 - 3) 자재 데이터: 해당 기간 입고된 플라스틱 용기(LDPE)의 로트(Lot) 정보 호출 |
| 데이터 분석가 -분석 및 패턴 발견 |
- SQL 추출 결과 : 특정 작업조 근무 시, 미립자가 상승하는 패턴은 없으나, 용기 세척 공정(WFI Rinsing)의 수압 데이터가 특정 시점부터 미세하게 하락한 패턴 발견 - 대시보드 시각화 : 세척 수압과 최종 미립자 수 사이의 강한 음의 상관관계를 그래프로 확인 |
| 최종 액션 - 해결 방안 및 실행 |
- 원인 규명 : 용기 세척기 필터의 미세 폐쇄로 인한 세척 수압 하락으로 용기 내부 미립자가 충분히 제거되지 않았음 (KGMP 공정 밸리데이션 일탈) - 조치 : 필터 교체 및 세척 공정의 수압에 - input 지표 대한 실시간 알람 기준을 강화하는 CAPA(시정 및 예방조치) 수립 - 결과 : 이후 생산된 배치에서 미립자 수가 1,200개 수준으로 정상 회복 |
'▷ 아티클 스터디' 카테고리의 다른 글
| [내일배움캠프_QA/QC 5기] 14일차 _ 아티클 스터디 "사용자 행동 데이터 분석 ; ② 넷플릭스와 아마존은 데이터 분석을 어떻게 할까요?" (1) | 2026.03.26 |
|---|---|
| [내일배움캠프_QA/QC 5기] 12일차 _ 아티클 스터디 "데이터 분석가 갖춰야 할 9가지 역량" (0) | 2026.03.24 |
| [내일배움캠프_QA/QC 5기] 8일차 _ 아티클 스터디 "데이터 기반 의사 결정의 장점" (0) | 2026.03.18 |
| [내일배움캠프] QA/QC 5기 - 2일차 _ 아티클 스터디 "데이터 분석가는 어떤 일을 하는가?" (0) | 2026.03.18 |
| [내일배움캠프] QA/QC 5기 - 4일차 _ 아티클 스터디 "데이터 분석이란 무엇일까?" (1) | 2026.03.12 |