본문 바로가기

IT STORY

빅데이터와 구글 그리고 SNS

728x90
SMALL

일상에 침투한 IT기기들-스마트폰, 테블릿PC

 

안녕하세요 새로운 이야기를 시작하려고 합니다. 컴퓨터에 대해서 얼마나 이해하고 있는지 나 자신에 대해서도 물어봅니다. 예전 시작은 열정적이고 컴퓨터에 대해서 알아가면서 무엇이든지 다 알것 같았는데 지금은 오히려 점점 모르겠다는 생각이듭니다. 실제 사용하지 않으니까

한글이나 엑셀 정도 밖에는 알지 못하는 상황이 되었습니다. 워드프로세서 자격증이나, 컴퓨터 활용능력 자격증을 지금 준비하고 있고 필기시험 합격해서 실기를 준비중입니다. 너무 늦었다고 생각을 합니다. IT에 대해서는 얼마나 알고 있을까? 그리고 활용에 대해서도 이제 배우고 있습니다. 

IT라고 하면 시대가 변화하는 만큼 모르는 것이 너무 많고 분야가 너무 방대해서 회사에서도 업무가 업데이트되고 늘 변화하는지라 따라잡기도 힘들다는 생각이 먼저 듭니다. 그만큼 회사생활에 적응하려고 늘 노력하고 노력하고 있습니다. 토태되지 않으려고 합니다. 쉬고 나오면 책한권 분량의 공문서와 늘 업데이트 되어서 나오는 시스템들 또 배워야 하고 업무숙지해야 합니다. 늘 다양하게 변화하는 IT분야에서 나오는 여러가지 시스템들에 대해서 프로그램에 대해서도 배워야 조직사회에서 살아남습니다. 그게 지금 시대에 살아가는 직장인들의 현실입니다. IT를 모릅면 지금 살아남기 힘든 세상이 되었습니다. 한가지 예를 든다면 IT중에서도 스마트폰만 없으면 한 인간이 얼마나 불안한 사람으로 만드는지 알수 있습니다. 그만큼 스마트폰에 의존하고 편리하게 살아가고 있다고 생각합니다. 업무가 안될 정도 입니다. 필자 역시 이제는 IT시대 맡게 생활패턴 역시 스마트폰이 없으면 불편하다. 왜냐하면 바쁜 일상속에서 만능으로 통하는 스마트폰이기 때문이다. 은행업무부터 코로나19시대에 예방접종예약부터 몇칠전에는 어머니 독감예방접종예약도 스마트폰으로 예약을 했습니다. 몇년전만 해도 네비게이션이 큰 선풍을 일으켰지만 이제는 스마트폰에 밀려서 거의 사용하지 않고 있습니다. 스마트폰에 어플을 설치하여 네비게이션으로 활용하고 그리고 또 한가지는 디지털카메라 시장이 사라졌다는 사실입니다. 

전문적인 사진이 아니고서는 스마트폰 기능중 하나로 사진촬영이 이제는 카메라 수준을 넘어서고 있기 때문이다. 메모리 기능이 늘어나면서 동영상 촬영도 가능하게 되었다. 

고가의 스마트폰 하나면 개인용 컴퓨터 수준으로 사용할 수 있기 때문입니다. 필자 역시 그렇게 사용하고 있습니다. 그래서 이제는 현대인들에게는 꼭 필요한 존재이지만 늘 스마트폰을 사용하여 사용시간이 늘어나고 여러가지 휴유증이 나타나지만 그래도 있어야지만 하는 필수템이 되었습니다. 

당연히 있어야 하는 미륵같은 존재가 되어버렸습니다. 한개로도 모자라서 두개씩 가지고 다니는 사람도 있습니다. 그만큼 현대인에게 직장생활하는 필자에게도 꼭 필요한 기기가 되어버렸습니다. 

몇년전만 해도 직원들 교육이나 미팅시간에 필요한 것들을 구두로 전달하고 교육하고 전달사항을 알려주고 그랬지만 이제는 스마트폰은 각자 생활속에서 필수템이 되어서 직장생활속에 깊숙히 들어와 있습니다. 지금 필자가 살고 있는 시대는 IT바람에 그리고 4차산업혁명이 거세게 불고 있는 상황입니다. 인공지능에 암호화폐혁명과 그리고 블록체인, 비트코인, 자율주행차량과 전기차와 수소차까지 세상은 점점 많은 것들이 변화하고 사물인터넷등 다양한 일들이 주의에서 벌어지고 있습니다. 

점점 자동화되고 첨단화 되고 로봇들이 그리고 그 자리를 차지하고 있습니다. 가만히 있다가는 영화처럼 혹성탈출에 한 장면을 우리 스스로 느끼게 될지도 모르는 세상이 되었습니다. 

필자는 세상 따라잡기가 너무 힘든시대에 있는 것은 아닌가 하는 생각이 듭니다. 나름 너무 나태하게 세상을 바라만 보고 살아는지 모른다는 생각을 하게 됩니다. 더 적극적으로 세상과 부딪혀 보려고 합니다. 무기력한 나 자신이 너무 비굴하게 느껴집니다. 이제는 우리나라가 세계에서 IT강국으로 발전하는 단계인 만큼 스스로에게 의로를 해주고 싶습니다. 내 마음속에 있던 IT 꿈들을 일깨우면서 스스로의 힘으로 이겨내고 싶습니다. 이제부터 필자의 IT세상속으로 한 걸음 다가가겠습니다.

어떠한 고난이 닥쳐와도 이겨내고 스스로 힘으로 일어서겠습니다.

 

빅데이터와 구글 그리고 SNS

이제부터 IT이야기를 시작해 볼까 합니다. 재미있는 이야기부터 시작하도록하겠습니다.  믿거나 말거나이지만 지금부터 시작합니다. 지난 2016년 미국의 대통령 선거는 여론조사의 정확성에 대해 의문을 제기하게 만든 사건이었습니다. 여론조사 결과에서 대통령 당선 가능성이 더 높았던 후보는 힐러리

클린턴이었기 때문입니다. 하지만 대통령으로 도널드 트럼프가 당선되었고, 몇몇 언론에서는 뒤늦게 선거 전 빅데이터 분석에서 이미 트럼프가 대통령에 당선될 것임을 예측할 수 있었다고 주장했습니다.

구글 검색 빅데이터는 이미 트럼프가 대통령에 당선될 것을 알고 있었다고 합니다. 

「모두 거짓망르 한다」의 저자 세스 스티븐스 다비도위츠는 자신이 구글의 데이터 분석가로 있을 때의 한 사례를 소개했습니다. 도널드 트럼프가 여론조사 결과와는 달리 대통령에 당선 된 것과 관련해, 이미 4년 전 거의 정확하게 트럼프 후보의 지지 지역을 맞친 것입니다.  당시 저자는 오바마 대통령의 당선으로 미국 내에서 인종차별이 더 이상 문제가 되지 않을 것이라는 일반적인 생각과 달리 실제로 보이지 않는 곳에서 여전히 인종차별이 존재한다는 것을 입증하고자 했습니다. 그러기 위해 구글의 특정 검색어 빈도수와 지역 간의 관계에 대해 조사하면서 흑인 비하 발언 검색어 빈도수와 지역 관계를 분석했습니다. 그런데 이 분석 결과가 4년 후 대선에서의 트럼프 지지 지역 분포와 거의 유사함을 알 수 있었습니다. 이 지역 중 상당수는 사전 여론조사에서 힐러리가 앞서는 곳으로 분석된 곳들이었습니다.

 

그렇다면 여론조사는 빅데이터보다 정확하지 않은 것일까? 결론은 '항상 그렇지는 않습니다.' 어떤 조사는 사람들의 생각을 대체로 정확히 반영하는 반면 어떤 여론조사는 그렇지 않습니다.

그렇다면 어떤 여론조사가 빅데이터 분석 결과와 많은 차이를 보일까? 그것은 대체로 사람들이 공개적으로 이야기하기 꺼려하는 분야거나 자신의 이미지와 관련이 있는 분야라는 것이 저자의 주장입니다.

예를 들어 동성애나 성적 이슈와 관련된 것은 여론조사 방식으로 정확한 실체를 파악할 수 없습니다.

그렇다면 빅데이터 분석의 핵심 영역으로 생각되고 있는 SNS 분야는 어떨까?

한때 유튜브에서 가장 높은 조회수를 기록한 동영상은 약 23억 회의 조회수를 가진 싸이의 〈강남스타일〉이었습니다. 다른 측면에서 가장 높은 조회수를 기록한 포르노 동영상의 경우에는 조회수가 8천만 회였습니다. 두 동영상 간의 유튜브 조회수의 비율은 약 30:1인 셈입니다. 이 두 동영상이 페이스북에서 언급된 사례를 분석해 보겠습니다. 〈강남스타일〉이 페이스북에서 언급된 횟수를 감안하면 포르노 동영상에 대해서도 많은 수의 언급이 있어야 하나 경우 수십 건에 불과했다고 합니다.

또 다른 사례로 문예잡지인 〈애틀랜틱 먼슬리〉와 가십 위주의 잡지인 〈내셔널 인콰이어러〉의 발행부수가 거의 유사하지만, 페이스북에서는 〈앤틀랜틱 먼슬리〉의 '좋아요' 선택 비율이 무려 27배나 높았다고 합니다. 페이스북에서의 선호도가 실제 시장에서의 판매와 전혀 다른 결과임을 보여줍니다. 저자는 다음과 표를 예로 들여 빅데이터가 보여주는 결과에 대해 진실과 거짓 사례를 소개하고 있습니다.

 

                     진실을 보여주는 빅데이터 거짓일 수도 있는 빅데이터

검색어
조회수
클릭수
구매내역

SNS 담벼락
SNS 좋아요
개인 소개프필

진실을 보여주는 빅데이터 VS 거짓일 수도 있는 빅데이터

 

동영상 서비스인 넷플릭스도 초창기 가입자들에게 보고 실은 영상 타이틀을 신청할 수 있게 했는데 여기에 신청된 영상물의 상당수는 다큐멘터리나 교양물이였습니다. 그래서 관련 영상 콘텐츠를 서비스 했으나 정작 실제로 구매한 경우는 드문것으로 분석되었습니다.

이후 넷플릭스는 소비자의 선호도 분석에서 직접 묻는 방식을 배제하고 순수하게 클릭과 조회, 검색에 의존하기로 했습니다. 이 책에서는 그 외에도 다양한 사례를 소개하는데, 구글의 검색어 분석 결과와 사회고학적인 분석 결과를 비교하면서 사람들의 진실한 생각은 결국 구글의 검색어 분석 결과에 더 가깝다는 이야기를 전하고 있습니다. 왜 그럴까? 구글의 검색은 익명으로 이루어지고 개인적이며 무엇보다도 솔직하게 입력해야 자신의 원하는 것을 찾을 수 있기 때문입니다.

검색 빅데이터와 달리 SNS의 빅데이터는 솔직하지 못한 경우도 있습니다. 많은 기업에서 빅데이터 분석을 통해 중요한 결정을 내릴 수 있다고 생각합니다. 그리고 페이스북 같은 SNS의 데이터가 중요한 대상으로 인식되고 있습니다. 

하지만 페이스북이 솔직하지 않은 생각과 가식으로 넘쳐난다면 그 분석에 의존한 결과는 실제 시장이 원하는 방향과 다를 수 있습니다. 최근 페이스북이 미디어와 같은 길을 걷고 있는 게 아닌가 하는 생각이 듭니다. 어쩌면 빅데이터 분석 대상의 핵심으로 여겨졌던 SNS에 대해 다시 생각해봐야 하지 않을 까? '구글 신은 모든 것을 알고 있다.' 라는 말이 떠오른다. 거대 공룡기업이 방대한 빅테이터를 수집하고 있다는 생각을 하게된다. 지금도 구글은 스마트폰 어플이나 아드로이드 스마트폰 구글 플레이를 이용해서 정보를 수집하고 있다. 아무래도 어플을 이용해서 지도 찾기나 다른 방법을 구해서 많은 자료들을 수집하는게 아닌가 하는 의문을 가지게 된다. 

거대공룡기업 구글 방대한 빅데이터를 어느 순간부터 가지게 되었을까. 초창기로 한번 거슬러 올라가서 연구해볼 대상이다.

 

 

 

 

 

 

 

728x90
LIST