내일배움캠프(QC,QA_5기)

[내일배움캠프_QA/QC 5기] 25일차 _ 데이터리터러시

qc-standard 2026. 4. 10. 21:08

2026/04/10 Fri.

● 코드카타 레벨 1 끝내기 = 3 문제
취업 컨설팅 - 인사이트
● 데이터 리터러시 완강
  ● 절반 수강
● 서브 프로젝트 ppt

 


⊙ 코드카타 레벨 1 끝내기

https://qc-standard.tistory.com/44

 


 

⊙ 취업 컨설팅 - 인사이트

(질문) 사람人 이력서 제출했음에도 시간이 지나도록 열람이 되지 않은 경우

  • 이 질문을 한 이유는 나의 실제 사례이기 때문에 궁금해서였다
  • 그에 대한 답을 얻을 수 있어서 이것만으로 가치있는 시간이란 생각이 든다

 

(질문) 6시그마 자격증을 꼭 취득해야하는지?

  • 6시그마!!만 가지고 있다면 임펙트 없음
  • 공대생의 기초 수료 과정으로 여기는 자격증 → 도메인 관련 / 통계 관련 자격증을 가지고 있다면 씨너지
  • 6시그마를 취득할 예정이라면 다른 자격증 취득 권장

내가 궁금한게 많은 건지 40분이 짧다고 느껴졌다. 그 만큼 가치있는 시간이었다.

 


⊙ 데이터 리터러시 

 

● 데이터 리터러시 (Data Literacy) 정의

  • 데이터를 읽는 능력 ≒ 표나 그래프 해석 포함
  • 데이터를 이해하는 능력 데이터가 의미하는 바가 무엇인지 생각할 수 있는 능력
  • 데이터를 비판적으로 분석하는 능력 데이터를 곧대로 믿는 것이 아닌

→ 위 능력을 토대로 "결과를 의사소통에 활용할 수 있는 능력"
 데이터 주제에 대한 이해가 기반이 되어야 의사소통을 할 수 있음

데이터 수집 / 데이터 원천적 이해

→ 데이터 활용법 이해

→ 데이터를 통한 핵심지표 이해

--→  데이터 리터러시는 올바른 질문을 던질 수 있도록 만들어 줌   자기 자신에게 던지는 질문 (왜 하는지, 어떤 인사이트 도출이 목적인지,,, 목적 의식 고양)

 

 

 데이터 분석에 대한 착각

데이터 분석을 해봐야지
SQL, Python, Tableau 등 언어 툴을 학습
→ 데이터를 봐도 모르는 상황 도래
<데이터 분석에 대한 흔한 착각>
데이터를 잘 분석하면 문제, 목적, 결론이 나올 것이라고 생각
데이터를 잘 가공하면 유용한 정보를 얻을 수 있다고 생각
분석에 실패하면 방법론, 스킬이 부족한 것이라고 생각
데이터 리터러시 부족으로 생기는 상황!!이 더 많음

 

 

● 데이 터 해석 오류 사례

☑️ 심슨의 역설 (Simpson's Paradox)

'부분'에서 '부분'에서 성립한 대소 관계가 그 부분들을 종합한 '전체'에 대해서는 성립하지 않는 모순적인 경우를 말한다.
  전체에 대한 결론이 언제나 개별 집단에 그대로 적용되는 것은 아님
  데이터에 기반한 결론이라고 해서 이를 맹목적으로 받아들여서는 안됨

 

☑️ 시각화를 활용한 왜곡 

 
자료의 표현 방법에 따라서 해석의 오류 여지가 존재

 

☑️ 샘플링 편향 (Sampling Bias)

전체를 대표하지 못하는 편향된 샘플 선정으로 인해 오류가 발생
표본이 편향되면서 실제와는 다르게 해석하게 될 수 있음

 

☑️ 상관관계와 인과관계

상관관계
  • 두 변수가 얼마나 상호 의존적인지를 파악하는 것을 의미
  • 파악 방법은 한 변수가 증가하면 다른 변수도 따라서 증가/감소하되 그 추이를 따름

인과관계
  • 실질적으로 하나의 요인으로 인해 다른 요인의 수치가 변하는 형태를 의미
  • 원인과 결과가 명확한 것


상관관계는 인과관계가 아닌 것을 항상 유의해야 함
● 상관관계만으로 섣불리 의사결정 하지 않기
양쪽을 모두 활용하여 합리적인 의사판단 하기

 

 
 

데이터 활용 예제

더보기

Q1) 위 그래프를 통해 어떤 것을 말할 수 있나요?

● 개발 > 마케팅 > 인사, 영업 >재무 > 고객지원 순으로 인원수가 있음

● 인사, 영업부의 차이를 정확히 알 수 없음

● 개발을 주력으로 하는 회사인지 진잠할 수 있음

데이터 읽기

 

Q) 위 그래프를 작성한 사람은 무엇을 말하고 싶었을까?

● 개발 부서에 사람이 많다 → 개발부의 인원 감축?

● 개발, 마케팅에 비해 현저히 적은 인원의 CS(고객지원) → CS 증원

데이터 작업 전 알고 싶은 것을 생각해보는 목적 사고적 방식

 

 

 

● 데이터 분석에 대한 접근법

  • 위 단계 중 ‘생각’이 주요한 단계에서 데이터 리터러시가 필요
  • 데이터 분석이 목적이 되지 않도록 ‘왜?’를 항상 생각해야 함

 

 

● 문제 정의란?

실패하는 이유 : 풀고자 하는 문제를 명확하게 정의하지 않음!!

  • 데이터 분석 프로젝트의 성공을 위한 초석
  • 분석하려는 특정 상황이나 현상에 대한 명확하고 구체적인 진술
  • 프로젝트의 목표를 설정하고 분석 방향을 설정

 데이터 분석 시작의 첫걸음

 

 

● 문제 정의 사례 및 예제

더보기

문제 정의 사례

  • 상황: 매출 증가가 목표인 패션 플랫폼 A
  • 문제 정의: 매출을 어떻게 늘릴 수 있을까?
    • 문제 정의는 했지만, 모호하고 구체적이지 않음
    • 어떤 고객층, 제품에 초점을 맞출지에 대한 명확한 지침이 부재
    • 데이터 분석할 시 방향성을 잡기가 어려움
  • 문제 정의를 다음과 같이 수정해볼 수 있습니다.
    • 지난 6개월 동안 25 - 35세 여성 고객층의 구매 전환율이 급격히 감소했다. 이 고객층의 전환율을 2%에서 5%로 끌어올리기 위해 어떤 마케팅 전략을 적용할 수 있을까?
      • 구매 전환율: 고객이 방문한 후 구매까지 전환됐는지의 여부
      • 구매고객수/방문고객수*100 = 구매 전환율(%)

 

문제 정의 예제

  • 상황 : 3개월 전부터 자사 제품의 사용자 수가 감소하고 있다. 사용자 수를 늘리기 위한 포인트 이벤트를 하고 있지만, 효과가 없어 보인다. 또한 자사 제품 내 서비스 중 A 보다 B가 더 안 좋은 상황이다. 사용자가 줄었기 때문에, 수입도 감소하고 있다.효과가 없어 보인다.
  • 문제 정의
    1. 사용자 수 감소 : 사용자 수 감소로 인한 문제이나,,, 수입 감소가 주 문제라면 사용자 수 감소는 원인이 됨
    2. 이벤트 효과가 없다 : 이벤트가 효과적이지 않기 때문에 발생하는 문제가 근본적으로 해결되어야 하는 것일까?
    3. A 서비스 보다 B 서비스가 상황이 안 좋아진 이유를 살펴보아야 한다 : 그러나 이것을 근본적인 문제라고 하기에는 어려워 보입니다. - 과연 이걸로 문제를 해결할 수 있는지 생각해야 함
    4. 수입이 감소한 것이 문제다 : 매우 중요한 문제라고 판단됩니다.그러나, 단어의 정의에 있어 더 명확할 필요가 있습니다. 가령 수입이 의미하는 것이 매출액인지, 순이익인지 등을 고려해야 합니다.

→ 문제 정의는 더 복잡하고 시간 소요되는 과정
→ 항상 "문제를 올바르게 정의 하였는가?"라는 물음을 가지고 임해야 함.

 

 

● 문제  정의 방법론

☑️ MECE (Mutually Exclusive, Collectively Exhaustive, 미시)

  • 문제 해결과 분석에서 널리 사용되는 접근 방식
  • 문제를 상호 배타적(mutually exclusive)이면서, 전체적으로 포괄적(collectively exhaustive)인 구성요소로 나누는 것
  • MECE를 통해 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있음

각각의 개별 요소 + 중복되지 않게 = 합쳐졌을 때 완벽한 구조
를 이루는 방




잘못된 MECE 예시
  • 사람 - 남성, 여성, 아저씨로 나눔: 남성과 아저씨가 중복
  • 영화 장르 - 액션, 스릴러, 공포로 나눔: 멜로 코메디 등 누락 장르 존재
  • 자동차 - SUV, 세단, 쿠페, 현기차로 나눔: 분류 기준이 다름. 자동차 종류 VS 브랜드
  • 3학년 3반 학급원 - 영어 우수 학생, 수학 우수 학생으로 나눔: 분류 기준이 불명확, 서로 중복되고 누락된 정보가 존재

 

 

☑️ 로직 트리(Logic Tree)

  • MECE 원칙을 기반으로 복잡한 문제를 더 작고 관리하기 쉬운 하위 문제로 분해하는데 사용
  • 상위 문제로부터 시작하여 하위 문제로 계층적 접근
  • 일반적으로 도표 형식으로 표현되어 쉽게 파악할 수 있음
  • 로직트리를 활용하여 문제정의 해보기






수익성 개선 방법   -   매출 증대   -   신규 고객 매출 증대    -    신규 고객 수 증가
                                                                                       -    신규 고객 객단가 증가
                                                  -   기존 고객 매출 증대   -    이탈 고객 감소
                                                                                       -    기존 고객 객단가 증가

                            -   비용 감소   -    구조조정
                                                 -     원가절감
객단가
고객 1인당 평균 매출(평균 결제액)
 매출 ÷  고객 

매출
고객 수와 객단가의 
객단가 × 고객 

 

누락 / 중복 개념을 항상 살펴봐야함

 

 

● 로직 트리 Cheet Sheet

 

 

● 문제 정의 정리와 팁

< 문제 정의를 왜 하는 것인가?>

  • 문제 정의는 풀고자 하는 것을 명확하게 정의하고
  • 이것을 해결하기 위한 데이터 분석의 방향성을 정하고
  • 결과를 정리하고 해석하여
  • 더 나아지기 위한 새로운 액션 플랜을 수립하기 위함
  • 문제 정의의 핵심은 So What?? Why So?

So what?

  • 수집한 정보와 소재에서 ‘결국 어떻다는 것인지’를 알아내는 작업
  • 그래서, 따라서, 이렇듯 앞에 오는 정보나 소재에서 과제의 답변에 맞는 중요한 핵심을 추출하는 작업
  • 나타난 현상을 바탕으로 과제에 비추어 말할 수 있는 내용의 핵심을 추출하는 작업

 

Why So?

  • 왜 그렇게 말할 수 있는지
  • 구체적으로 무슨 뜻인지를 검증하고 확인하는 작업
  • So what?한 요소의 타당성을 자료 전체 혹은 그룹핑한 요소로 증명할 수 있다는 사실을 검증하는 작업

   

 

문제 정의 Tip

  • 결과를 공유하고자 하는 사람이 누구인지 정의하기
  • 결과를 통해 원하는 변화를 생각하기
  • 회사 소속이라면, 경영자의 입장에서 보려고 노력
  • 많은 사람들과 의견을 나눠보는 것도 방법
  • 반드시 혼자서 오래 고민해보는 시간을 가질 것

 

 

● 데이터의 유형 

☑️ 정성적 데이터 (Qualitative Data)

  • 비수치적인 정보로 사람의 경험, 관점, 태도와 같은 주관적인 요소를 포함
  • 텍스트, 비디오, 오디오 형태로 존재
  • 정형되지 않고 구조화 되어있지 않고 구조화하기 어려움
  • 새로운 현상이나 개념에 대한 이해를 심화하는데 사용

☑️ 정량적 데이터 (Quantitative Data)

  • 수치적으로 표현되는 정보로 양적인 측정과 분석을 통해 얻을 수 있음 
  • 데이터가 숫자 형태로 존재하기 때문에 통계적으로 분석하기 쉬움
  • 개인의 해석이나 주관이 적게 작용하는 객관성을 가지고 있음
  • 지표로 만들기에 용이

☑️ 데이터 유형별 비교

  • 비즈니스 목표를 위해서 두 가지 데이터를 적절하게 활용하는 것이 필요

☑️ 정량적 데이터의 활용

  • 객관적이고 측정가능한 지표를 만들기에 적합
  • 수치형 설문조사 데이터를 정량적인 기준으로 나눈 사례, 추천 지수(NPS)를 만들 수 있음

☑️ 통계적 분석 적용

  • 분포, 평균, 중앙값 등을 계산해서 데이터의 경향성과 패턴을 파악 가능 
  • 해당 내용을 근거로 의사결정 과정에서 중요한 판단을 내린다 

☑️ 다양한 데이터 분석 방법 적용

  • 비즈니스 분석, 예측 모델링, 추세 분석을 포함한 머신러닝과 같은 현대적 데이터 분석 기법에 활용
  • 이를 통해 미래 예측, 효율적 자원 배분, 시장 변화에 대한 적응 가능

 

 

● 지표설정

☑️ 지표란?

  • 특정 목표나 성과를 측정하기 위한 구체적이고 측정 가능한 기준
  • 목표 달성도를 평가하고 전략적 결정에 필요한 핵심 정보를 제공
  • 정의한 문제에 대해 정확하게 파악하기 위해서 필요
  • 문제 정의 : 어떤 문제를 풀고자 하는가?
    지표 : 어떤 결과를 기대하는가?에 대한 정량화된 기준

 

● 주요 지표 이해하기 

☑️ Active User (활성유저)

  • Active User 역할
    : Active User에 대한 정의에 따라 전략과 방향이 달라짐
    : Active User에 대한 정의로 ‘이탈 유저’가 정의
    : 투자를 위한 서비스 지표에 중요한 역할을 하게 됨
  • Active User 설정 사례

 

☑️ Retention Ratio (재방문율)

  • 서비스를 사용한 사람이 다시 서비스를 사용하는 비율 %
  • 리텐션이란 한번 획득한 유저가 서비스로 다시 돌아왔는가?에 대한 지표
    : 리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음
    : 서비스(특히 앱서비스) 성장에 있어서 매우 중요한 지표
  • 측정 방법
    - N-Day 리텐션
      : 최초 사용일로부터 N일 후에 재방문한 Active User의 비율
      : 일반적으로 사용하는 리텐션 지표
    - Unbounded 리텐션
      : 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율
      : 정기적으로 반복해서 방문하는 서비스가 아닐 경우 적합
      : 이탈률의 반대 개념
      : 사용 빈도가 높지 않은 서비스에 활용하기 적절한 지표
    - Bracket 리텐션
      : 설정한 특정 기간을 기반으로 재방문율을 측정 
  • 재방문율에 대한 이해
    : 리텐션이 높은 세그먼트를 발굴하는 작업이 필요함
    : 사후 분석 시에 용이

 

☑️ Funnel (퍼널)

  • 유저들이 어디서 이탈하는가?를 확인하기 위한 구조화
  • 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정
  • 각 단계의 전환율 (or 첫 유입 대비 전환율)을 측정
  • AARRR - 프레임워크 - 단계별 전환율을 지표화하여 서비스 보완 지점을 찾음 
    : Acquisition: 유입
    : Activation: 활성화
    : Retention: 재방문(재구매)
    : Revenue: 수익
    : Referral: 추천

 

☑️ LTV (Life Time Value, 고객 평생 가치)

  • 해당 유저가 우리에게 평생 주는 이익은 얼마나 될까?
  • 고객 생애 주기: 한 명의 유저가 서비스를 사용하기 시작하여 이탈할 때까지의 기간
  • 한 명의 유저가 생애 주기 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화 한 것
  • LTV는 유저와의 관계를 측정하고, 이를 사업적 이익으로 가져가는데 중요한 지표
  • LTV가 높다는 것은 해당 서비스와 관계가 좋고, 충성도가 높은 고객이 많다는 것
  • 산출 방법은 다양 - 자사 서비스에 딱 맞는 LTV를 산출하는 것은 매우 어려운 일

 

● 북극성 지표 

☑️ 북극성 지표란?

  • 제품/서비스의 ‘성공’을 정의
  • 제품/서비스가 유저에게 주는 core value를 가장 잘 나타낸 것
  • 장기 성장을 위해 필수적으로 모니터링 해야 함

☑️ 좋은 북극성 지표의 특징

  • 제품/서비스 전략의 핵심
  • 유저/고객이 제품/서비스에서 느끼는 가치
  • 회사의 사업 목표를 나타내는 지표 중 선행지표 (후행X)

☑️ 좋은 북극성 지표를 위한 체크 리스트 

  • 유저가 목적을 달성하는 때가 언제인가?
  • 모든 유저가 해당되나?
  • 측정 가능한 지표인가?
  • 측정 주기가 적절한가? (일, 주, 월, …)
  • 외부 요인으로부터 영향을 많이 받진 않는가?
  • 북극성지표의 성장이 사업의 성장과 함께하는가?
  • AARRR 퍼널 전 과정이 북극성 지표에 영향을 주는가?
  • 북극성 지표의 변화가 적어도 매주 관찰가능한가?

 

☑️ 북극성 지표가 중요한 이유: 방향성

  • 제품/사업 조직이 무엇에 최적화되어야 하고, 무엇을 포기해도 되는 지에 대한 방향 제시  
  • 제품/사업 조직의 진척과 가치창출을 전사에 보여줌 → 적극적으로 지원, 제품개발 액션 실행속도가 빨라짐
  • 제품/서비스 조직이 결과에 책임을 지도록 함 → 비즈니스 임팩트에 따라 평가 가능

☑️ 북극성 지표가 중요한 이유: 효율 증대

  • 전 직원을 하나의 목표에 집중시킴  
  • 서로 상반된 목표에 집중하거나, 중복으로 일하는 것을 방지 (MECE한 구조)

 

 

● 결론 도출 

☑️ 결과와 결론 차이

결과 = 무엇을

결론 = 그것이 왜 중요한지?

● 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력
● 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음
● 계산과 분석을 해서 나온 결과물
● 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
● 기반한 해석, 추론 또는 권고 사항을 포함
● 목적에 대해 어떤 의미가 있는지 설명하는 것

결론은 결과들을 바탕으로 도출된 해석이나 추론

실제로 우리가 필요한 것은 ‘결론’이지만, 보통 결과를 많이 이야기 함

 

☑️ 결론 도출 시 주의사항

  • 결과 - 결론 도출 시에는 스토리텔링이 필요  
  • 데이터를 통해 알 수 있는 범위에서만 생각해야 함

 

  • 개인의 해석이나 주관이 적게 작용하는 객관성을 가지고 있음
  •  

☑️ 결론을 잘 정리하는 법

  • 개인의 해석이나 주관이 적게 작용하는 객관성을 가지고 있음
  • 결론을 공유할 대상이 누구이며, 어떻게 변화하길 원하는지? 생각하기
  • 단순하고 쉽게 전달
    : 핵심 지표 위주로
    : 지표를 해석하는 방법에 대해서도 설명
    : 활용할만한 포인트 제안
    : 액션 아이템을 제안 하는것이 핵심
  • 흥미 유발
    : 고민하고 필터링 하기
    : 궁금한 사람들을 위해서는 디테일한 문서 따로 공유
  • 대상자 관점에서의 접근
    : 공유 받는 사람(=대상자)의 시선에서 이해하기 쉽도록 정리
    : 지식의 저주(=내가 아는 걸 모두가 안다는 착각)에 빠지지 않고 논지를 뒷받침 해줄 자료들을 함께 첨부
    : 대상자의 허들이 낮은 시각화 활용
  • 시각화 팁
    : 대상이 직관적으로 이해할 수 있도록 구성
    : 보통 선, 막대 그래프로 거의 대부분의 리포팅이 가능
    : 각 그래프의 범례와 단위 함께 표기해주기
  • 결론 보고서에 쓰면 좋은 플로우
    : 전체 내용을 한 문장으로 정리하는 요약
    : 해당 보고서의 메인 주제
    : 해당 보고서를 쓴 이유와 원하는 변화
    : 문제 정의 단계
    : 핵심 내용 전개
    : 결론 및 액션 아이템
  • 정리
    : 앞서 문제 정의, 지표 설정을 할 당시의 목적을 떠올리며 정리
    : 결론을 공유할 대상이 누구이며, 어떻게 변화하길 원하는지? 생각 

 

☑️ 데이터 리터러시란?

  • 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의하는 것
  • 목적을 달성하는데 필요한 데이터와 지표를 설정하는 것
  • 데이터를 어떻게 봐야 문제의 정보를 효과적으로 얻을 수 있는지 분석하는 것
  • 단순히 데이터를 보는 방식이나 분석 방법론, 통계지식에 매몰되지 않는 것
  • 왜?를 항상 생각하기