본문 바로가기
독서

세상을 읽는 새로운 언어, 빅데이터

by 기이한날개 2022. 1. 24.
제목 세상을 읽는 새로운 언어, 빅데이터
저자 조성준
페이지 276
출간일 2019년 8월 21일
ISBN 9788950982737

 

코딩이나 데이터 과학에 대해서 정말 아무것도 모르는 사람들에게도 추천할만한 입문서로, 빅데이터가 무엇이고 어떤 방식으로 활용해야 하는지에 대해 개괄적인 내용을 담고 있는 책이었다.

 

책 내용 요약

1. 빅데이터 시대의 서막

오늘날 인터넷과 센서의 발달로 인해 얻을 수 있는 데이터가 많아졌고, 컴퓨터의 발달로 대용량 데이터를 처리하고 계산할 수 있게 되어 빅데이터의 시대가 열렸다. 우리는 이제 원하는 데이터를 실시간으로 받아 분석할 수 있는 환경에 놓였고, 여러 산업에서 다양한 방식으로 데이터를 활용할 수 있게 되면서 무궁무진한 가능성이 생겼다. 이전에는 상상도 할 수 없었던 일이었지만 이제는 포도 생산지의 날씨 정보를 기반으로 와인의 품질을 예측할 수도 있고, 회사 내 조기퇴사자의 수나 영화 관객 수를 사전에 예측하는 것도 가능해졌다.

 

2. 데이터 기반 의사결정

데이터를 기반으로 한 의사결정은 과거에 사용되던 '감에 의한 판단'보다 정확하고 객관적이며 때로는 새로운 인사이트를 주기도 한다. 예를 들어 기계 부품 교체 시기에 대해서 이전에는 기술적인 한계로 'n개월 정도 후에 부품을 교체하라'는 일반적인 조언밖에 할 수 없었다면, 지금은 각각의 기계에 센서를 달아 가동시간, 가동 주기 등의 데이터를 통해 소모된 정도를 파악해 기계마다 정확한 부품 교체 시기를 알 수 있다. 또한 이런 정보를 기업이 알 수 있다면 기업에서 기계 a/s서비스를 먼저 제안할 수도 있고, 특정 시기에 필요한 a/s기사의 수를 예측해보는 것도 가능하겠다.

 

3. 빅데이터가 만능은 아니다

(1) 데이터는 인과관계가 아닌 상관관계만을 설명할 때가 많다.

집에 책이 많은 가정의 아이들이 어휘력도 뛰어나다는 결과가 있을 때, 집에 책을 많이 가져다 놓으면 아이들이 독서를 많이 하고 자연스럽게 어휘력이 좋아진다고 생각하기 쉽다. 하지만 그것이 집에 책이 많아서 어휘력이 좋아진 것인지, 아니면 단순히 책을 좋아하는 부모를 닮아 책을 좋아하는 등 다른 요인 때문인지는 알 수 없다. 

(2) 의사결정자에 의해 실행되지 않는 인사이트는 무의미하다.

책 내용에 따르면 많은 경우 데이터에 의해 도출된 인사이트를 현업자들이 거부하는 경우가 많다고 한다. 기존에 해오던 방식이나 노하우 등에 따라서 결정하려는 경향이 있고, 이를 해결하기 위해서는 현업자들에 대한 빅데이터 교육이 필요하다고 생각된다.

(3) 반대로 기획 없는 빅데이터 활용은 불가능하다.

단순히 데이터를 주고 '알아서 인사이트를 찾아봐라'라고 해서는 의미 있는 인사이트를 찾을 수 없다. 기획자가 충분히 명확한 의도를 가지고 방향성을 설정한 후에야 데이터 과학자는 가설을 세우고 검증해서 인사이트를 찾아낼 수 있다. 특히 데이터 과학자는 현업을 잘 모를 수 있기 때문에 결국 인사이트에 대한 판단을 하고 그것을 바탕으로 직접 비즈니스 활동을 하는 의사결정자의 역할이 상당히 중요하다고 할 수 있다.

 

개인적인 감상, 생각

데이터 분석에 관심을 가지고 있던 나에게는 전체적인 그림을 그려볼 수 있는 좋은 기회였다. 특히 전문적인 내용보다는 개괄적인 내용을 다루고 있고 데이터의 활용 방법, 데이터 활용 시 주의점 등을 담고 있어서 어떤 방향으로 활용하는 것이 좋은지에 대한 큰 그림을 그려볼 수 있었다. 

 

다양한 산업군에서 데이터를 사용하는 예시를 들어놓은 것이 굉장히 유익했다. 미처 생각해보지 않았던 생소한 분야에서 이미 데이터를 다양한 방법으로 활용하고 있다는 것을 알 수 있었고 그걸 바탕으로 새로운 적용 방법도 고민해볼 수 있었다. 와인 품질 예측, 선박 대기시간 분석, 에어컨 사용량 분석, 영화 평점 분석, 텍스트 리뷰의 자연어 분석, 신용카드 실적에 따른 회원 프로모션 기획, 컨퍼런스콜을 통한 주식 가격 예측, 영화 관객 수 예측, 손글씨 인식, 타이타닉 호 생존자 예측 등의 예시를 찾아볼 수 있었다.

 

가장 인상 깊었고 중요하다고 생각한 부분은 기획에 관한 내용이다. 단순히 데이터를 가지고 있으면 거기에서 인사이트를 찾을 수 있지 않을까 생각했었는데, 그것보다 정확한 의도를 가지고 기획을 먼저 해두어야 그것에 맞는 데이터를 수집하고 가공해서 분석할 수 있다는 것을 깨달았다. 여태 데이터 분석과 관련한 몇 가지 간단한 프로젝트를 기획하면서 데이터를 무작정 뽑아와서 사용 가능한 데이터를 보면서 뭔가 유의미한 가설을 세우려고 했었는데, 먼저 필요에 의해 방향성이 뚜렷한 기획을 하는 편이 낫다는 확신을 가질 수 있게 되었다. 

 

관련 영상

최근에 본 데이터 분석 관련 유튜브 영상에 작가이신 조성준 교수님이 게스트로 나오셔서 데이터 분야 커리어에 대해 QnA를 진행하신 영상을 인상 깊게 봤다. 데이터 분야의 진로에 대해서 고민했던 나에게 큰 도움이 된 영상이다. 

https://youtu.be/nPjsKGi1EIQ

 

보면서 단순히 데이터 관련 지식 이외에도 도메인 지식을 가지고 있는 것의 중요성을 느낄 수 있었다.

 

기회가 된다면 다음에 <빅데이터 커리어 가이드북>도 읽어볼 생각이다.

'독서' 카테고리의 다른 글

90년생이 온다  (0) 2022.02.20