데브코스/TIL

2023-11-21 데이터 기반 의사 결정

Hynnjnn 2023. 11. 21. 19:18

2-1 데이터 문해력 퀴즈 리뷰

헷갈렸던 문제
회사 데이터가 별로 없다면 빅데이터 기반의 데이터베이스가 아니더라도 보통의 Production DB로 사용되는 데이터베이스를 데이터 웨어하우스로 사용해도 된다.

 

2-2 데이터 기반 의사결정이란?

Data Driven Decision vs Data Informed Decision

 

데이터에서 인사이트 찾기

  • 데이터를 기반으로 중요 지표 정의 -> 시각화
  • 가설을 바탕으로 실제 데이터를 보고 확인 (A/B 테스트)

데이터 분석 케이스

  • 중요 지표 대시보드 만들기
    고객 이탈률, 잔존률 분석 by 코호트 분석
    동일한 특성을 갖는 고객 그룹 = cohort

 

2-3 조직 구조의 중요성과 트렌드

3가지 데이터 팀 조직 구조

  1. 중앙 집중 구조
    데이터 팀원 간의 데이터, 지식 경험 공유 쉬움
    다른 부서 만족도는 낮음
  2. 분산 구조
    데이터, 지식, 경험 공유가 안됨 -> 중복 가능성 높아짐
    데이터 메쉬를 통해 해결하는 트렌드
  3. 하이브리드 구조
    중앙집중 + 분산 구조
    데이터팀에 소속, 부서 파견 형태
    다른 부서 만족도는 높아짐

데이터 메쉬
중앙 관리와 표준을 염두에 둔 분산 데이터 아키텍처 개념
마이크로 서비스와 흡사한 원칙

 

2-4 데이터 조직의 일주일 살펴보기

애자일 기반
애자일, 스크럼 보드 - JIRA 써보고싶다

 

2-5 좋은 지표(KPI)란?

Key Performance Indicator

  • 조직 내에서 달성하고자 하는 중요한 목표
  • 적을 수록 좋음 - 지표끼리 충돌 방지
  • 시간의 흐름에 따라 -> 대쉬보드를 통해 확인

선행지표가 아닌 후행지표 = 일이 벌어지고 난 후 결과

 

2-6 KPI와 선행/후행 지표 예

Controllable Input Metrics(선행 지표) vs Output Metrics(후행 지표)

인풋을 어떻게 관리하냐 -> 아웃풋 영향

즉, 선행 지표가 개선이 되어야 후행지표도 따라온다.

 

인풋 지표: 직접 통제 가능

아웃풋 지표: 직접 통제 불가능

 

2-7 시각화 대시보드 툴 소개

대시보드 or BI(Business Intellligence)툴

데이터 민주화, 데이터 탈중앙화

 

2-8 [실습] 지표 정의하고 차트 만들어보기

Tableau Public

  • 무료
  • CSV 파일만 데이터 소스로 지원
  • 모두에게 공개됨 - 포폴에 활용 가능

x축 = Column = dimension : 지표를 어떤 관점에서 볼건지. 보통 시간의 흐름

y축 = Rows = measure : 우리가 알고싶은 지표. 우리가 트래킹할 지표

 

대시보드 = 차트(시트)들의 집합

 

잘 만든 대시보드 -> 퍼블릭으로 올려서 포폴에 활용 가능