내일배움캠프(QC,QA_5기)

[내일배움캠프_QA/QC 5기] 46일차 _ 태블로 1강 | 태블로 라이브세션 2회차

qc-standard 2026. 5. 12. 23:10

2026/05/12 Tue. 일간 계획

주간 계획↓

O ● 인턴 자소서 수정 ing ● 인턴 지원 완료
X ● 인턴 제출 서류 준비 ing ● 라이브 세션 - 복습
O  태블로 강의 ing ● adsp
O  라이브세션 복습+미니과제 ing ● 태블로 완강
O  adsp 공부

X  아티클 스터디

 


아티클 스터티

( https://qc-standard.tistory.com/75 )


 태블로 강의 - 1강 

 커리큘럼 : 강의 + 라이브세션 + 미니과제 + 과제

시각화를 해야하는 이유

시각피질 (Visual cortex)
-
망막에서 전달되는 시각 정보를 수신 및 통합 처리하는 뇌의 주요 피질 영역 - 눈을 통해 들어온 시각적 정보는 시신경을 거쳐 후두부에 위치한 시각 피질에서 시각적 처리를 담당

 

시각 피질에 전달되어 0.2~0.5초 사이에 주의해야하는 정보와 주의받지 못한 정보로 구분
→ 크기나 모양, 색깔 등 특징이 있는 정보들은 단기 기억으로 전환되어 7개의 항목을 약 10~15초 동안 저장
→ 이 상태에서 학습이 이루어지면 장기기억으로 전환되고, 그렇지 않으면 망각하게 됨
시각적 분석에 사용할 영역은 감각 기억과 단기 기억 활용 → 효과적으로 정보 전달 가능
색상, 크기, 모양 등을 활용하면 단기 기억을 활용하여 기억에 오래 남게 됨
💡 Visual Analytics
인간의 시각적 지각 능력을 활용해서 데이터를 표현하고 분석하는 과정

 

BI ?  = 비즈니스 인텔리전스 = Business Intligence

  • 조직에서 비즈니스 데이터를 수집, 분석 및 시각화하여 실행 가능한 통찰과 의미 있는 정보를 생성하기 위해 사용하는 기술, 전략 프로세스를 의미
  • 유용한 정보를 얻기 전에 데이터의 수집, 축적, 분석, 보고와 같은 과정을 거침
  • 핵심 구성 요소 및 주요 프로세스
  • 데이터 시각화
  • 데이터 분석
  • 대시보드 생성
  • 여러 데이터 소스와의 통합
  • 데이터 변환 및 모델링
  • 공유 및 협업
  • 실시간 데이터 모니터링
  • 대표적인 BI 도구
    : Salesforce - 'Tableau'
    : Microsoft - 'Power BI'
    : Google - 'Looker Studio' 

태블로란?

  • 단순 시각화 툴이 아니라 데이터 전처리(데이터 병합, 정리, 변형)부터 시각적 분석 / 협업 / 자동화 / 거버넌스까지 가능한 시각적 분석 플랫폼
  • Tableau Prep 
    : 데이터를 결합, 변형, 정리하는 전처리 과정 담당 → 데이터 정리 작업 시간 단축
  • Tableau Desktop
    : 데이터 탐색, 시각화, 분석 수행 데이터 분석 및 시각화 담당
    : 추세 및 분포 시각화 / 집계 / 데이터 필터링 / 데이터 정렬 또는 그룹화 / 특정 이상값 드릴 다운
  • Tableau Server & Tableau Cloud
    : 조직 내 협업, 배포, 거버넌스 관리 공유 담당
    : 데이터 관리 / 콘텐츠 관리 / 구독, 댓글, 알림, 다운로드 기능
  • Tableau 구조
Creator (크리에이터)
  • 대상 : 데이터 분석가, BI 개발자, 데이터 사이언티스트
  • 비용 : $75/month
  • 주요 기능:
    • Tableau Desktop + Prep + Server/Cloud Creator 권한 포함
    • 데이터 연결: 다양한 데이터 소스(파일, DB, 클라우드)에 직접 연결 가능
    • 데이터 준비: Tableau Prep으로 데이터 정제, 변환, 결합 가능
    • 분석 및 시각화 제작: 차트, 대시보드, 스토리 생성
    • 게시: 만든 콘텐츠를 Tableau Server/Cloud에 배포
Explorer (익스플로러)
  • 대상: 비즈니스 사용자, 팀 리더, 실무 분석 담당자
  • 비용 : $42/month
  • 주요 기능:
    • Tableau Server/Cloud에서 웹 브라우저 기반으로 사용
    • 데이터 탐색 & 분석: 게시된 데이터 소스에 연결해 새로운 워크북/뷰 생성 가능
    • 편집 및 저장: 기존 대시보드를 수정하고 저장 가능
    • 협업: 구독, 알림, 댓글 기능 활용
Viewer (뷰어)
  • 대상: 경영진, 보고서 수요자, 일반 사용자
  • 비용 : $15/month
  • 주요 기능:
    • Tableau Server/Cloud에서 제공되는 대시보드와 리포트를 보기 전용
    • 필터, 하이라이트, 드릴다운 같은 기본 상호작용 가능
    • 구독/알림/댓글 기능으로 협업 가능

왜 태블로를 써야하는가?

1. 데이터 요청 및 문제 정의
2. 데이터 수집 및 접근
3. 데이터 정제 및 전처리
4. 탐색적 데이터 분석(EDA)
5. 분석 및 모델링
6. 데이터 시각화 및 대시보드 구축
7. 인사이트 전달 및 커뮤니케이션
8. 데이터 품질 및 지표 관리
9. 협업 및 지원 업무
10. 운영 및 개선 활동 

이 모든 작업을 수작업하기에는 시간적으로 부족하기에 "검증된 솔루션을 빌려 쓰기 위함"이다

 

태블로 장점

1. 사용자 친화적 인터페이스
 : 마우스로 필드를 드래그 앤 드롭 가능 / 단순 조작으로 데이터 분석 및 시각화 가능
2. 자유도 높은 시각화
 : 단순한 그래프가 아닌 게임처럼 생긴 대시보드, 인터랙티브 스토리텔링, 웹 애플리케이션 형태의 시각화도 가능
3. 다양한 데이터 소스에 쉽게 연결 가능
 : 서버주소, 계정 정보만 입력하면 대부분 자동 연결 가능
4. AI 기술을 통한 분석
 ○ Tableau Pulse
   : 중요한 지표(KPI)에 변화가 생기면, Slack, 이메일, 모바일 앱을 통해 실시간 알림을 받음
○  Tableau GPT (자연어 분석)
   : 사용자가 “지난달 가장 많이 팔린 제품은 뭐야?”라고 질문만 입력하면, 태블로가 적절한 시각화로 자동 응답
SQL이나 수식 없이도 누구나 분석 가능
5. 활성화된 커뮤니티
 ○
Tableau Conference -수천 명의 분석가, 개발자, 기획자, 디자이너들이 모여 직접 만든 대시보드를 소개하고, 최신 기능을 체험하며, 데이터와 관련된 고민과 경험을 나눔
 ○ Tableau Public - 누구나 대시보드를 무료로 만들고 공유할 수 있는 공간

 

● Tableau 기초

○ 연결 유형

  • 파일에 연결
    - 텍스트 파일 or 자세히
  • 서버에 연결
  • 저장된(또는 게시된) 데이터 원본에 연결

○ 연결 방법

  • 텍스트 파일 or 자세히
  • (csv 파일을) 태블로 통합문서에 드래그 앤 드랍

 

● Tableau UI


⊙ 태블로 라이브세션 - 2회차

● 13개 필드 151개 행 = 13개 열 151개 행

● 필드명 / 물리적 테이블 / 원격 필드명 = 필드에 대한 정보
    - 필드명을 바꿀 수 있어서 : 실제 필드명 + 화면상 필드명이 나타남
● 샘플 데이터를 통한 데이터 정보를 알 수 있음
● 데이터 정보

 

☑️ 실습

더보기
차원 (Dimension) - 정성적 데이터
: 
데이터를그룹화, 분류, 필터링하는 기준이 되는 값

  • 측정값 (Measure) - 정량적 데이터
    : 데이터를 집계(합계, 평균, 최대, 최소 등)할 수 있는 수치형 값

 

☑️ 막대 차트

시트 지우기 / 오름차순 / 내림차순 / 마크다운(그래프에 숫자 표기)
tip 행/열에 뭘 올려야할지 모르겠다?
ctrl + 행 또는 열에 들어갈 필드 선택 : 필드 다중 선택 → 표현방법 - 원하는 그래프 선택
 
필터를 이용할 수 있음



타입별 색상을 바꿀 수 있음
화면 우측에 필터를 표시할 수 있음
마우스 오른쪽을 누른 상태로 드러그앤드랍하면 됨
카운트(고유) :  겹치는거 제외하고 볼때 

 

Q) 제일 많은 타입은?
Q) 체력이 가장 많은 포켓몬은?
Q) '리'자로 끝나는 포켓몬?


Q) 타입 1이 격투 타입 중 공격력이 가장 강한 포켓몬은?


Q) 타입2가 있는 포켓몬 중에 제일 많은 타입1+타입2 조합은?








Q) 합계 능력치가 높은 상위 30개 중 두번째로 많은 포켓몬은?


필터를 남겨놓은 상태로



 

☑️ 히스토그램 : 수치형 데이터의 분포를 시각화한 데이터

구간차원 : 어디부터 어디까지 자를 것이냐









왜도 첨도를 이용해 치우침의 정도를 알 수 있음

간단한 방법

총합을 히스토그램에 드러그앤드롭하면 간단하게 만들 수 있음
 
   
   

 

☑️ 박스플롯















 

☑️ 스캐터 차트








 - 공격과 방어 모두 약함
 - 공격은 약하고 방어는 강함 = 방어형 
 - 공격은 높은데 방어는 약함 = 공격형
 - 공격과 방어 모두 강함






파생변수 만들기







클러스터 만들기 = 군집 만들기







K - means 만들 수 있음
K - means 클러스터 : 유사한 데이터를 \(K\)개의 그룹(클러스터)으로 자동 분류하는 비지도 학습 알고리즘

 

☑️ 레이더 차트?