아이티랩 - 데이터 시각화로 비즈니스 문제 해결하기

프랑스의 국민영웅이자 백년전쟁의 영웅, 잔 다르크. 조금 허무맹랑해보이긴 하지만 프랑스 동부 지역에서 농부의 딸로 태어나 어느날 문득 나라를 구하라는 하나님의 계시를 받고 전쟁에 참여한 것으로 알려져 있습니다이유야 어찌됐건 당시 잉글랜드와 프랑스 사이에 벌어진 백년전쟁에서 번번히 패하던 프랑스는 잔 다르크의 영웅적인 활약으로 드라마 같은 역전승리를 이끌어내고대부분의 전투에서 승승장구할 수 있었습니다.

빅데이터_문제해결_데이터_기반_디자인씽킹

다른 시대, 다른 주제이긴 하지만 이 잔 다르크의 이야기를 바탕으로, 오늘날 시장경제와 비즈니스 기업들에 대해 다시 살펴보면 어떨까요 ? 오늘날 비즈니스 조직들 역시 시장이라는 무한경쟁의 전쟁터에서 너도나도 기업혁신을 외치지만 번번히 실패하는 경우가 허다합니다. 누구나 애플, 에어비앤비, 우버와 같은 혁신적인 제품과 서비스로 시장의 승리를 거머쥐고 싶어하나 실상은 쉽지 않습니다. 이토록 기업혁신이 어려운 이유는 잔 다르크 같은 인재가 없어서일까요, 신의 계시를 받지 못해서일까요?

googletag.cmd.push(function() { googletag.defineSlot('/6357468/0.Mobile_Article_intext_1_300_250', [300, 250], 'div-gpt-ad-1468307418602-0').addService(googletag.pubads());googletag.pubads().collapseEmptyDivs();googletag.pubads().enableSyncRendering();googletag.enableServices();googletag.display('div-gpt-ad-1468307418602-0'); });

데이터를 통한 기업 혁신, 어떻게 시작해야 하나?

여기 신의 계시나 잔 다르크 같은 인재가 없어도 기업의 승리를 이끌어 줄 만한 열쇠가 있습니다두 말할 것도 없이 데이터’이지요데이터가 혁신을 이끌어낸다는 데 부정하는 리더는 없을 겁니다철저한 사용자 경험의 데이터 분석을 토대로 혁신적인 동영상 스트리밍 서비스를 제공하는 넷플릭스(Netflix), 빅데이터를 통한 재고관리 시스템 혁신을 통해 다품종 소량생산 방식을 토대로 신제품 실패율 1%를 기록한 패션 브랜드 자라(ZARA) 등은 데이터를 통한 기업혁신의 대표적인 사례입니다뻔한 외국 사례가 아니더라도최근 몇 년사이 데이터를 무기로 창업 후 2년 만에 식재료 새벽배송 시장에서 유통업계 공룡기업을 제치고 업계 1위를 달성한 사례도 있습니다출시 4년 만에 매출 50배 증가, 200만 회원수를 자랑하는 유통업계 새벽배송의 선구자 마켓컬리’입니다.

마켓컬리는 '멍멍이'라는 빅데이터 분석을 위한 인공지능 서비스를 운영하고 있다. (출처: 마켓컬리 공식 유튜브 채널)

마켓컬리는 ‘멍멍이’라는 빅데이터 분석을 위한 인공지능 서비스를 운영하고 있다. (출처: 마켓컬리 공식 유튜브 채널)

신선 식품 배송의 핵심은 적절한 소비자 수요에 따른 재고관리그리고 물류센터의 고도화이므로 수요예측을 위한 데이터 활용이 필수적입니다마켓컬리 김슬아 대표는 소비자 수요 예측을 위해 빅데이터와 머신러닝을 조합하여 실제 수요값과 발생할 주문량을 예측하는 기술을 통해 재고관리 시스템을 혁신하고 기업을 성공으로 이끌 수 있었습니다.

이렇게 데이터를 제대로 분석하고 활용할 수만 있다면 혁신이라는 승리를 거머쥐는 것은 얼핏 어렵지 않아 보입니다그런데 유념해야할 점이 있습니다대체 어떻게 데이터를 제대로 분석하고 활용할 수 있을까요흔히 데이터를 분석한다고 하면 R, 파이썬머신러닝, AI 등 어렵고 복잡하면서도전문적으로 보이는 연관어들을 먼저 떠올리기 마련입니다그런데 정녕 비즈니스 조직의 데이터 활용을 위해 반드시 수억 원의 비용이 수반되는 머신러닝이나 인공지능혹은 고도화된 분석도구가 필요한 것일까요?

이 물음의 답을 우리는 데이터 시각화에서 찾을 수 있습니다데이터 시각화는 전문적인 데이터 분석기술이나 도구 없이도 일반적으로 가장 쉽고 빠르게 데이터를 활용할 수 있는 방법입니다데이터 기반의 기업혁신을 바라는 비즈니스 조직이라면 데이터 시각화를 제대로 알고 활용하는 역량을 반드시 익힐 수 있어야합니다.


데이터 시각화, 가장 쉽고 빠르게 데이터를 활용하는 방법

원본 데이터와 시각화한 데이터의 차이. 아주 간단한 시각화 작업만이라도 데이터 간의 상관관계를 분석하고, 인사이트를 도출해내기에 충분하다.

원본 데이터와 시각화한 데이터의 차이. 아주 간단한 시각화 작업만이라도 데이터 간의 상관관계를 분석하고, 인사이트를 도출해내기에 충분하다.

데이터 활용 역량을 의미하는 데이터 리터러시(Data Literacy)’말 그대로 데이터를 보고 읽는 것을 의미합니다단순히 이야기하면 얼마나 데이터를 잘 보고 읽는 지에 대한 역량으로데이터를 수집가공하고 분석하는 것 뿐만 아니라 데이터 기획시각화 역량을 포함하는 개념이라 할 수 있습니다.

이중에서도 데이터 시각화는 누구나 데이터를 활용할 수 있는 가장 쉽고 빠른 방법입니다먼저 복잡한 데이터 분석 기술이 없는 사람도 쉽게 시각화 차트를 만들 수 있어데이터를 직접 활용해보기까지 진입 장벽이 낮습니다또 특별한 분석 역량이 없어도 시각화 차트 내 요소의 시각적 패턴을 근거로 데이터 의미를 해석하므로 누구나 쉽게 데이터 인사이트를 발견하고 스토리텔링이 가능합니다.

이 말의 의미는 전통적인 비즈니스 조직에서 문제해결을 위해 그동안 전적으로 데이터 분석과 활용을 IT부서에 맡겼던 것에서 벗어날 수 있다는 것을 말합니다적절한 데이터 시각화 역량을 가지고 있다면 IT 부서에 의존하지 않고도 현업 부서 간 유연한 커뮤니케이션과 데이터 기반 사고가 가능하다는 것입니다그렇다면 데이터 시각화를 통한 문제해결 과정에서 필수적으로 수반되는 탐색적 시각화와 요약적 시각화에 대해 좀 더 자세히 알아보겠습니다.

데이터의 의미를 이해하는 과정, 탐색적 데이터 시각화

흔히 수집한 데이터가 들어왔을 때이를 다양한 각도에서 관찰하고 이해하는 과정을 탐색적 데이터 분석(Exploratory Data Analysis; EDA)이라 부릅니다한마디로 데이터를 분석하기 전에 그래프나 통계적인 방법으로 자료를 직관적으로 바라보는 과정입니다유사한 맥락에서 탐색적 데이터 시각화(Exploratory Data Visualization) 역시 수집한 데이터를 시각화 차트로 만들어보고다양한 각도에서 시각화 결과물을 탐색하면서 데이터의 의미를 이해해가는 과정을 의미합니다

탐색적 데이터 시각화는 비즈니스 문제를 해결하는 과정 중에서도 특히 사용자에 대한 공감과 올바른 문제 정의가 필요할 때 주요하게 쓰입니다수집된 데이터를 통해 상황을 빠르게 파악한 후가설을 설정하고 다시 데이터를 통해 검증하며 문제정의를 완성해가는 모든 과정에서 탐색적 데이터 시각화 활동이 이루어진다고 볼 수 있습니다.

좀 더 쉬운 이해를 돕기 위해 대표적인 문제해결전략인 디자인씽킹 기반의 프로세스에 실제로 탐색적 데이터 시각화를 활용하여 문제를 효과적으로 정의하고 리소스를 단축한 사례를 살펴보겠습니다.

탐색적 데이터 시각화를 활용한 문제해결 사례 맛보기

데이터 시각화를 통한 문제해결과정에서 탐색적 데이터 시각화는 주로 빠른 실행과 반복이 필요한 공감, 문제정의 그리고 테스트 단계에 사용된다. (출처: 씽킹랩)

데이터 시각화를 통한 문제해결과정에서 탐색적 데이터 시각화는 주로 빠른 실행과 반복이 필요한 공감, 문제정의 그리고 테스트 단계에 사용된다. (출처: 씽킹랩)

“제주도의 대중교통 관련 불만을 해결하자”라는 주제의 문제를 위의 문제해결도식의 과정대로 데이터 시각화를 통해 공감하고, 검증하는 과정입니다. 먼저 제주도의 대중교통 관련 불만을 해결하기 위해 중점적으로 살펴봐야 할 핵심 키워드는 무엇일까요? 실제 제주도의 대중교통으로는 지하철이 존재하지 않고, 버스가 대표적인 대중교통이므로, ‘버스를 핵심 키워드로 설정합니다. 이 버스라는 키워드를 통해 최근 1년 동안의 웹, SNS, 블로그 등의 소셜 데이터 분석을 진행해본 결과는 아래와 같았습니다.

'버스' 키워드에 대한 연관 말뭉치를 시각화한 워드클라우드 차트

‘버스’ 키워드에 대한 연관 말뭉치를 시각화한 워드클라우드 차트

버스와 관련되어 도출된 핵심 연관 키워드들 중에서도 빈도가 많고유의미한 키워드 4개는 다시 아래 1~4번으로 정리되는데여기에 대중교통과 관련된 불만인 만큼 아이디어를 더해서 교통사고라는 키워드를 5번으로 추가해보았습니다.

  1. 정류장
  2. 버스비
  3. 버스기사
  4. 버스시간표
  5. 교통사고

이 5개 핵심 키워드를 조합하여 아래와 같은 가설을 설정해보았습니다여기에 탐색적 데이터 시각화 과정을 이용하여 비교적 간단하게 가설을 검증해볼 수 있습니다우선 첫 번째 가설을 시작으로몇 가지 사례만 탐색적 데이터 시각화를 통해 빠르게 확인해보겠습니다.

  1. 정류장이 불편하다
  2. 버스비가 비싸다
  3. 버스기사가 불친절하다
  4. 버스시간표가 알기 어렵다
  5. 교통사고가 잦다

 

1. 정류장이 불편하다?

 

“1 정류장이 불편하다라는 가설은    생각하면 정류장의 양과 질적인 부분에 관한 아래  개의 가설 나눌  있습니다.

  • A. 제주도에는 정류장이 충분하지 않다
  • B. 제주도의 정류장은 질이 좋지 않다

A의 가설을 검증하기 위하여일단 전국의 광역시급 이상 시도들의 정류장 수와 인구 수를 가져와서 시각화하면 아래와 같은 그래프를 발견할 수 있습니다.

도시별 전체버스정류장수 대비 인구수 비교

도시별 전체버스정류장수 대비 인구수 비교

정류장 정보가 없었던 인천을 제외하면 평균적으로 인구가 많은 지역이 정류장도 많이 보유하는 것으로 나타났습니다특히 서울시가 생각보다 정류장이 많이 없다는 사실은 주목할 만합니다다만, A가설(제주도에는 정류장이 충분하지 않다) 검증하기에는  데이터는 충분하지 않았고면적 대비 정류장의 인구 대비 정류장의     탐색적인 시각화 작업이 필요하다는 것을   있습니다이에 따라 정류장의 수를 면적으로 나눈 수치를  시도별로 시각화하면 아래와 같습니다.

정류장의 수 대비 지역면적 상대비교(좌), 정류장수 대비 지역별 인구수 비교

정류장의 수 대비 지역면적 상대비교(좌), 정류장수 대비 지역별 인구수 비교

첫 번째 그래프에서 보이는 것과 같이 면적에 비해 정류장의 수는 서울이 가장 많게 나왔으며, 제주는 평균적인 모습을 보였습니다. 대략적으로 보기에는 인구의 규모와 비례하는 것 같아 보이나, 두 번째 워드클라우드 그래프를 보면 제주는 오히려 인구에 비해 다른 지역보다 정류장이 많은 축에 속한다는 것을 알 수있습니다. 따라서, 가설(제주도에는 정류장이 충분하지 않다) 사실이 아닌 것은 틀린 가설이 됩니다.

그렇다면 가설(제주도의 정류장은 질이 좋지 않다) 어떨까요사실질적인 부분(정류장이 훌륭한지 엉망인지)   있는 데이터는 설문조사나 품질에 관한 지표들인데이는 굳이 데이터를 시각화해보지 않더라도 인터넷 검색을 통해서 보다 간단히 파악할  있습니다.

카카오로드맵을 통해 살펴본 제주도의 버스정류장 현황. 단순히 폴대형 표지판만 세워진 버스정류장도 있고 인도와 차도의 구분이 거의 없을 만큼 간격이 좁아서 버스를 기다리는 승객이 안전하게 머무를 수 있는 공간이 없다.

카카오로드맵을 통해 살펴본 제주도의 버스정류장 현황. 단순히 폴대형 표지판만 세워진 버스정류장도 있고 인도와 차도의 구분이 거의 없을 만큼 간격이 좁아서 버스를 기다리는 승객이 안전하게 머무를 수 있는 공간이 없다.

일반적인 버스 정류장에 비해제주도 버스 정류장”을 검색했을 때 나오는 이미지들은 대체로 ‘정류장’ 수준이 아닌 단순 표지판 수준의 표시에 그친다는 것을 알 수 있습니다. 이 외에도 아래와 같이 정류장에서 기다리는 사람들의 시선을 가로막는 구조물이나, 차도로 고개를 내밀어야만 오고 가는 버스를 확인할 수 있는 형태의 불편한 버스 정류장도 존재했습니다. 따라서, B가설(제주도의 정류장은 질이 좋지 않다) 성립하는 으로 판단되었습니다.

다시 정리해보면, 첫 번째 가설이었던 “제주도의 버스 정류장은 불편하다”는 “A.정류장의 수가 충분하지 않다”와 “B.정류장의 질이 좋지 않다” 두 가지로 세분화 되었었습니다. 이후 탐색적 시각화와 정성적인 아이데이션 조사기법 등을 복합적으로 활용하여 B. 제주도 정류장의 상태와 퀄리티가 좋지 않다 적합한문제정의로 도출되었음을 확인할  있었습니다.

 

2. 버스비가 비싸다

 

두번째 가설인 버스비가 비싸다 국버스운송사업조합연합회에서 매년 발행하는 버스통계편람의  시도별 일반버스와 좌석버스 버스비 데이터를 통해서 데이터 시각화하여 쉽게 검증 가능합니다.

지역별 일반 버스비 평균가격

지역별 일반 버스비 평균가격

2018 10 평균 버스비 데이터를 기준으로 시도별 일반버스의 버스비 평균가격은 1,334원이므로먼저 추세선으로 평균 기준을 점선으로 표시할  있습니다 기준선에 비하면 제주도의 버스비는 평균보다 저렴하며전국 광역시급 이상 시도 중에서 가장 저렴한  확인할  있습니다.

지역별 좌석버스비 평균가격

지역별 좌석버스비 평균가격

좌석버스의 버스비를 막대 그래프 시각화해본 결과도 마찬가지입니다데이터가 없는 대전을 제외하고는제주도는 여전히 가장 낮은 좌석버스비 보이고 있습니다. 따라서두번째 가설(버스비가 비싸다역시 성립되지 않는 것을 확인할  있습니다.
 
이처럼 탐색적 데이터 시각화를 활용하면 수집된 데이터에 대한 의미를 다양하게 분석해보고 이해하는 과정을 통해 보다 빠르고 효과적으로 비즈니스의 문제해결을 위한 가설 검증이 가능합니다.

다양한 차트 결과물을 한 눈에, 요약적 데이터 시각화

앞에서 언급한 탐색을 통해 다양한 차트 결과물들을 도출했다면 그 다음은 요약적 데이터 시각화(Summary Data Visualization)가 필요한 차례입니다쉽게 말하면 다수의 시각화 차트를 한 눈에 확인할 수 있도록 설계한 화면인 데이터 시각화 대시보드 안에서 차트 결과물들을 하나로 종합하여 볼 수 있도록 요약적으로 제시하는 것이지요

한 화면에 압축적으로 요약한 다양한 시각화 차트 결과물을 대시보드라 부르며, 대시보드는 개별 차트를 볼 때보다 더욱 종합적이고 직관적인 인사이트 도출을 가능하도록 돕는다.

한 화면에 압축적으로 요약한 다양한 시각화 차트 결과물을 대시보드라 부르며, 대시보드는 개별 차트를 볼 때보다 더욱 종합적이고 직관적인 인사이트 도출을 가능하도록 돕는다.

단순히 ‘차트의 모음’을 떠나서 때로 데이터 시각화 대시보드는  여러 부가기능을 통해 더 빠른 인사이트 도출을 지원하기도 합니다. 예를 들면 데이터 필터와 차트 간 인터랙션 기능 등이지요사용자는 필터를 통한 데이터 조회 기간 변경세부 데이터간 연관성 파악을 위한 차트간 인터랙션 기능 등을 이용하여 더 효과적이고 빠르게 요약적인 데이터 시각화를 경험하기도 합니다.

하나의 대시보드를 인터랙티브하게 탐색할 수 있는 하이라이팅, 필터, 데이터 인터랙션 등이 적용된 화면 예시

하나의 대시보드를 인터랙티브하게 탐색할 수 있는 하이라이팅, 필터, 데이터 인터랙션 등이 적용된 화면 예시

데이터 시각화 대시보드에서 인사이트를 발견하는 과정은 데이터를 보고 그 의미를 읽어내는 데이터 리터러시 그 자체나 다름없습니다이렇게 요약적 데이터 시각화를 통해 다양한 데이터 속에서 인사이트를 찾고이를 의사결정의 근거로 활용하는 데이터 기반 의사결정’ 프로세스를 경험할수록 조직의 데이터 리터러시 역량은 빠르게 성장할 수 있습니다.

· · · · ·

당면한 비즈니스 문제를 해결할 혁신적이면서도 비용효율적인 방법은 결코 멀리 있지 않습니다기업 데이터의 십중팔구는 분명 어렵고 복잡한 데이터 분석 기술이 아니더라도 탐색적요약적 데이터 시각화를 제대로 활용할 수만 있다면 충분한 인사이트를 발견할 수 있을 것입니다어느날 문득 우리도 잔 다르크와 같이 대시보드에서 기업의 문제를 해결할 인사이트를 얻고 드라마 같은 역전승리를 끌어내기를 기대해봅니다.


기업의 데이터 시각화 도입 컨설팅 및 대시보드 구축 서비스를 진행하고 있습니다.
※ 이 글은 데이터 시각화 전문기업 뉴스젤리 블로그에도 게재됐습니다.
※ 이와 같이 데이터 시각화 전문 콘텐츠를 월 1회 메일함으로 보내드립니다. (☞ 구독 신청하기)
※ 데이터 시각화의 다양한 트렌드와 정보를 빠르게 얻고 싶다면? (☞ 시각화 커뮤니티(페북 그룹) 가입하기)

의견 0 신규등록      목록