닫기 4차산업혁명시대
인간의 자리를 묻다
닫기

데이터 저널리즘의 탄생, 그리고 SK 텔레콤의 역할

2017.04.27 FacebookTwitterNaver

흔히 프랑스의 철학자 르네 데카르트를 근세 철학의 아버지라고 부른다. 데카르트는 감각의 정확성에 대해 의문을 던지는 것으로 수많은 가설에 대한 회의론을 제기하여 이러한 생각의 결과로서 그 유명한 “나는 생각한다, 고로 존재한다” 라는 결론에 이를 수 있었다. 즉, 사물의 본성에 대하여 완전하게 보편적이고 누구에게나 이해될 수 있고 절대적으로 확실한 설명이 제시되었는가에 대한 의문에 대해서, 근본적으로 참인 이성적인 원칙이 존재하며, 감각으로부터 독립된 이성적, 합리적, 논리적 사고를 통하여 진리를 발견할 수 있다고 믿었다.

이러한 논조를 “합리론”이라고 부르며, 이러한 철학적 바탕에 기원하여 데카르트는 그 자신이 수학, 기상학, 광학, 역학 등 수 많은 과학 분야에서도 업적을 남겼다. 이후 근대 과학 발전의 근간이 되었던 뉴턴의 물리학 이론들 또한 이러한 합리론의 연장 선상에서 만들어졌다. 그리고 필자는 이러한 합리론 철학이 비교적 근대의 컴퓨터 개념의 탄생에까지 이어졌다고 본다.

반면 합리론의 반대편에는 “경험론”이 있는데, 경험론의 대표적인 철학자가 영국의 데이비드 흄 이다. 경험론에서는 모든 지식은 감각적 경험으로부터 유래한다는 것을 기본 가정으로 하며, 인간의 모든 지식을 관념의 관계와 사실의 문제 두 개의 범주로 나누었다. 그리고 관념 또한 여러 감각기관의 관찰에 의하여 종합된 하나의 인상이라고 보았으며, 인간들이 경험적 신념을 논리적 인과관계로 착각하는 것에 대하여 통렬한 비판을 가하였다.

데이터 저널리즘에 대한 글을 쓰면서 갑자기 왜 뚱딴지처럼 서양 근대 철학을 이야기하는지 궁금할 것이다. 왜냐하면, 최근의 빅데이터와 인공지능으로 대표되는 산업과 사회의 변화는, 어떻게 보면 그동안 과학과 공학 세계를 이끌어 왔던 합리론, 혹은 연역법적인 사고방식으로부터, 수많은 관찰 결과들로부터 현상을 분석해 내는 경험론, 혹은 귀납법적인 사고방식의 패러다임으로 이동하는 변화를 의미하는 것이기 때문이다.

즉, 저널리즘에서도 어떤 사회적 현상을 추론을 통해 분석하고, 가설을 세우고 이를 뒷받침할 수 있는 데이터를 수집하여 제시하는 방법론이, 이제는 이 복잡한 사회를 대변하기에는 공신력 확보에 있어서 한계에 이르렀다는 반성이 있으며, 그러므로 이제는 특정한 방향성을 갖지 않은 수많은 빅데이터 들의 분석으로부터 가설을 세우고, 이를 또 다른 데이터들을 통해 검증하는 방법론이 제시되고 있다. 그리고 이것을 데이터 저널리즘이라고 부른다.

물론 말처럼 쉬운 일은 아니다. 먼저 무엇보다도 공신력 있는 데이터들이 많아야만 그 안에서 왜곡되지 않은 인사이트를 발견할 수 있다. 또한, 여러 종류의 데이터들을 교차 분석해 보면서 데이터 간의 연관관계를 찾아내는 데이터 사이언티스트의 역량이 필요하며, 이를 위해 많은 소프트웨어 도구들과 클라우드를 비롯한 각종 IT 인프라들을 이용할 줄 알아야 한다.

그리고 이러한 역량은 단지 데이터 저널리즘 관련자들에게만 필요한 것이 아니라, 4차 산업혁명의 도래를 맞아서 수많은 사물로부터 발생하는 엄청난 양의 데이터들을 통해 경쟁의 원천이 되는 새로운 노하우들을 개발해야 하는 일반 경제 활동 주체들에게도 똑같이 요구되는 역량이다.

SK텔레콤은 통신 사업자라는 업의 특수성 때문에 일찍이 이러한 빅데이터의 수집, 처리, 활용, 보안에 관하여 국내 어느 업종의 어느 회사와도 비교할 수 없는 전문성을 쌓아왔다. 일례로 SK텔레콤의 빅데이터 서버에 하루에 업데이트되는 정보의 양은 250TB 수준이며, 이 수치 또한 통신망이 빨라지며, 스마트 폰에서 제공하는 정보의 종류가 많아지고 IoT 생태계가 만들어지면서 사용자뿐 아니라 사물에서도 데이터들이 발생하기 시작하면서 급격히 증가하고 있다.

물론 구글이나 페이스북 같은 글로벌 사업자들은, 이러한 데이터의 중요성을 누구보다도 더 먼저 알아차리고 사용자들의 검색 키워드, 주위 친구들의 성향, 주로 방문하는 웹사이트 등의 정보들을 상상을 초월할 만큼 글로벌 스케일로 모았다. 그리고 이를 통하여 수백조 원의 시가총액을 가진 회사들을 만들어 낼 수 있었다.

이러한 빅데이터들이 자신들의 삶과 큰 연관이 없다고 믿는 사람들도 많을 것이다. 하나 예를 들어보겠다. SK텔레콤에서는 서울/경기지역의 기지국마다 촘촘하게 온도, 습도, 대기압을 측정할 수 있는 서비스를 제공하고 있다. 즉, 서울 지역의 기상 상태가 아니라 특정 동 단위의 기상 상태를 제공하는 것인데, 이 정보를 통해 어떤 프랜차이즈 업체는 오토바이를 타고 배달을 나갈 수 있는 범위를 실시간으로 조정하고 있다. 즉, 비가 올 확률이 높다면 사고의 위험이 크기 때문에 배달 반경을 좁히는 것이다.

이를 뒤집어서 데이터 저널리즘의 사례로 만들어 본다면, 보험사에서 제공하는 교통사고에 대한 수년간의 데이터베이스와 위치 정보, 그리고 그 위치의 일기정보를 합쳐서 단순히 “비 오는 날에는 운전 조심하세요”가 아닌, 구체적인 사고 확률을 포함한 정확한 인사이트를 독자들에게 전달할 수 있을 것이다.

외국의 경우에는 이미 스포츠 영역을 중심으로 엄청난 발전이 이루어지고 있다. 최근 미국 PGA 골프 중계를 보다 보면 특정 선수가 퍼팅할 때마다 몇 미터 거리에서는 한 번에 넣을 확률이 몇 %이고, 두 번에 넣을 확률이 몇 %인 것까지 정확히 나오면서, 다른 선수들과의 비교 분석까지 실시간으로 제공되는 것을 볼 수 있는데, 이렇게 중계하는 것과 “저 선수는 아무리 봐도 퍼팅이 좀 약점인 것 같습니다” 라고 중계하는 것의 신뢰도와 중계 자체의 매력도는 비교가 되지 않을 것이다.

이것이 가능하게 된 것은 먼저 연간 130만 회 이상의 샷을 레이저, 모바일 기기, 위치 센서 등을 통해서 수집하도록 개발된 샷링크 (Shotlink) 플랫폼이 있었기 때문이고, 두 번째는 고객들에게 더 즐거운 중계를 제공하고자 하는 PGA 사무국의 혜안이 있었기 때문이며, 마지막으로 이러한 통계들을 조건 없이 공개하는 데에 동의한 PGA에서 활동하는 골프 선수들이 있었을 것이다.

데이터 저널리즘이 실현되기 위해서는 선결되어야 할 것들이 있다. 첫 번째는 일단은 기본 재료가 될 수 있는 데이터들이 많이 존재하여야 하며, 두 번째로는 이러한 데이터들을 공개하는 데에 있어서 개인 정보 보호가 철저하게 지켜져야 할 것이고, 마지막으로 데이터를 분석할 수 있는 역량을 갖출 수 있도록 많은 교육프로그램이 마련되어야 할 것이다.

SK텔레콤은 이러한 변화를 이끌어가는 사업자로서 단순히 이러한 데이터를 통하여 사업을 영위하는 것에 그치는 것이 아니라, 사회의 구성원들이 좀 더 데이터에 친숙해지고 좀 더 객관적으로 사회 현상을 파악할 수 있도록 사회 전체의 역량을 끌어올리는 데에도 노력을 기울일 것이며, 이러한 노력의 일환으로 앞으로 더 많은 데이터를 대중들에게 제공하는 데에 앞장설 것이다.

FacebookTwitterNaver