데이터 신뢰도 높이고 개인정보 보호 강화해야

요즘 TV 방송이나 광고, 언론을 통해 쉽게 자주 접할 수 있는 단어 중 하나가 바로 ‘빅데이터’와 ‘사물 인터넷’이다.

ICT 분야의 새로운 패러다임으로 국가사회 경쟁력 향상의 원동력으로 자리 잡은 빅데이터와 사물인터넷은 최근 몇 년간 ICT 시장을 가장 뜨겁게 달구고 있는 핫이슈가 되고 있다.

특히 빅데이터의 경우에는 맞춤형 광고나 마케팅 측면에서도 대단히 유용한 기술이며, 기상이나 질병, 교통뿐만 아니라 범죄 예방 등 다양한 분야에서 활용되면서 국민들에게 정보를 제공하고 이를 통해 피해를 사전 예방하는 등 후생 증대 차원에서도 널리 쓰이고 있다.
 
공공 영역에서 뿐만 아니라 일반 기업에서도 빅데이터를 기반으로 한 다양한 고객 맞춤형 서비스를 제공하고 있어, ICT 업계 종사자가 아닌 일반 소비자들도 빅데이터라는 단어에는 매우 친숙할 것이라 생각된다.

빅데이터는 행복하고 안전한 사회 구현을 위한 과거, 현재, 미래 분석 및 예측을 위한 자산이며, 빅데이터가 바꿔 놓을 세상은 우리가 사는 세상을 예측 가능하게 만들어서 매우 편리하게 만들 것이라는 데 대다수가 동감할 것이다.


사전 동의 방안의 합리화

그러나 한편으로는 마치 빅데이터를 쓰면 우리 사회에 산적해 있는 문제가 술술 풀리고, 기업에게는 손쉽게 막대한 수익을 안겨줄 ‘마법의 지팡이’처럼 과대 포장되고 있다.

빅데이터는 문제를 풀 도구이지 목표가 될 수는 없다.

전쟁에 나선 장수에게 칼은 이기기 위한 도구에 불과하듯이, 빅데이터도 데이터 분석을 통해 가장 효율적인 답을 찾기 위한 수단이지 답은 아니다.

또한 빅데이터, 클라우드, 사물인터넷은 연결성과 개방성의 확대로 과거에는 상상할 수 없었던 데이터와 가치들이 생산, 유통되면서 개인정보의 활용은 더욱 증대되고 있고 이로 인한 위험성도 함께 높아지고 있는 것이 사실이다.

빅데이터 환경에서는 개인정보의 수집과 활용이 지금보다 훨씬 더 활발해질 것이기 때문에 사회적으로도 빅데이터와 관련해서는 개인정보 보호 이슈가 급속히 커지고 있다.

이에 빈번히 언급되고 있는 빅데이터에서의 개인정보 보호 이슈를 짚어보고 그에 대한 대안을 모색해보고자 한다.

새로운 가치를 창출할 수 있다는 점에서 많은 기업에서는 빅데이터 기술을 통한 사업 모델을 준비하고 있다.

그러나 강한 개인정보 보호 체계를 갖춘 우리나라의 법률들이 빅데이터의 필수조건인 데이터 마이닝 및 분석 처리에 관해 강력한 제재를 가하고 있는 것으로 나타났다.

우리나라에서 빅데이터 기술은 개인정보 보호법과 정보통신망 이용 촉진 및 정보보호 등에 관한 법률의 규정들에 의하여 그 활용이 제한될 수 있다.

위 법률들은 개인정보 처리자로 하여금 원칙적으로 정보 주체의 명시적인 동의를 받은 경우에 한하여 개인정보를 수집할 수 있고 그 수집 목적의 범위에서 이용할 수 있도록 하고 있다.

그러나 다양하게 실시간으로 생성되는 정보의 모든 특성을 예측하여 개인정보에 해당하는 경우 정보 주체로부터 동의를 받는다는 것은 사실상 불가능하다.

또한 빅데이터 환경에서는 이러한 개인 식별이 가능한 정보가 아닌, 비식별 정보를 활용한다 할지라도 다양한 결합에 의해 식별 정보로 전환되는 경우가 다수 발생하고 있다.

해외 사례를 살펴보면, 미국·일본 등은 개인정보를 수집한다는 사실을 미리 알리되 가입자가 이의를 제기하지 않으면 이를 활용할 수 있도록 하는 옵트아웃(opt-out) 방식을 채택하고 있으며, 비교적 개인정보 보호 인식이 강한 유럽에서도 통계·과학·학술 목적에서의 이용은 허용하며 공익적 가치가 큰 부분에서는 규제를 완화하는 방안을 추진하고 있는 것으로 조사됐다.


정보 주체의 권리 보장

이러한 사항을 참고하여 빅데이터의 경우 서비스를 제공하고자 하는 자가 사전에 서비스에 필요한 개인정보에 관한 사항을 신고해 허가를 얻는 경우 제한적으로 옵트아웃 제도를 적용할 수 있는 정책을 반영함으로써 빅데이터 서비스에 대한 활성화가 이루어질 수 있을 것이다.

또한 제한적 옵트아웃 제도 적용 시, 허용 기준에 대한 사항을 정의하고 이를 고시하여 정보 주체로부터 사전 동의를 얻는 방법도 고려해 볼 수 있을 것이다.

34.png


빅데이터의 핵심은 수집, 분석 기술의 발달로 인해 이용되는 소비자의 개인정보의 양(volume)이 많아진다는 점과, 다양한 원천과 다양한 유형의 정보(variety)가 실시간(velocity) 이용될 수 있다는 점이다.

빅데이터 환경에서 이용자와 관련된 다양한 정보(개인정보, 행태 정보, 프로필 정보, SNS 정보, 위치 정보 등)의 활용은 보다 가치 있는 서비스를 제공하기 위해 필요하다 할 수 있으며, 동일한 정보를 활용한다고 해도 그 활용에 있어서 프라이버시 침해의 정도는 정보 활용의 맥락에 따라 달라질 수 있다.

그러므로 빅데이터 환경에서는 정보를 이용하느냐 안하느냐의 단순한 이분법적 분류에서 벗어나서 다양한 맥락에 따라 소비자의 선호가 반영되고 행사될 수 있는 방안에 대한 고민이 필요하며, 이러한 것을 현실화할 수 있는 방안으로 소비자 통제(consumer control)가 실질화될 수 있는 방안에 대한 고민이 시작돼야 할 것이다.

소비자 통제는 소비자의 어떤 정보가 활용되는지(개인정보의 범주화와 이에 대한 선택 및 변경), 누구에 의해 자신의 정보가 활용되는지에 대해 소비자 자신이 아는 것에서 더 나아가 본인의 정보에 대한 선택 및 변경, 어떤 맥락에서 자신의 정보가 활용되는지에 대한 선택 및 변경(정보수집에 대한 디바이스 및 서비스상의 온오프 기능), 어떤 종류의 서비스를 제공받을지에 대한 선택(관심 영역에 대한 선택 및 변경) 등을 정보 주체가 할 수 있도록 하는 방안이다.

이는 정보를 활용하여 영리를 추구하고자 하는 기업의 입장에서는 고민하기 힘든 부분이므로 정부 차원의 전문 기관에서 제도적 방안을 마련할 것이 요구된다.

예를 들면 개인정보 수집 및 이용에 관한 동의서에 대해서도 기업이나 기관에서는 소비자가 알기 쉽고 이해하기 쉽도록 가이드라인을 마련하여 작성할 수 있게 해야 할 것이며, 작성된 이용약관이나 개인정보 보호방침, 개인정보 수집 및 이용에 관한 동의서가 소비자 중심적으로 작성됐는지 심사할 수 있는 제도를 마련해야 한다.


더 중요해지는 데이터 추적성
 
빅데이터를 잘 활용하는 것은 국가나 기업에 유익하다.

그러나 이런 데이터는 개인들로부터 제한된 동의를 받고 수집됐거나, 정부와 기업들이 임의로 데이터를 취합·가공하는 과정에서 당초 수집 목적이나 정보 보유 기간에 위배될 가능성이 높다.
 
그러나 그러한 경우마다 해당되는 데이터에 대해 다시 동의를 받고, 데이터를 찾아내어 삭제하는 것 등은 사실상 어려움이 많다.

빅데이터 환경에서는 이러한 데이터 추적성의 확보가 더 중요해질 것이다.

추적성이라고 하는 것은 1)발생된 문제를 찾아서 시정할 수 있어야 하고, 2)만일 유출된 문제라면 검사 과정의 문제를 확인
할 수 있어야 하고, 3)왜 발생했는가를 알 수 있어야 한다.

빅데이터 환경에서 데이터의 추적성이 중요한 이유는 크게 두 가지로 볼 수 있겠다.

먼저 데이터의 신뢰도 문제이다. 빅데이터 분석관련 자료들을 보면 대부분이 소셜 데이터를 사용하고 있다.
 
보다 더 검증되거나 높은 신뢰도를 확보했고 여러 변수를 고려했다는 빅데이터 분석 사례가 발표되고 있지만 결국 소셜 분석인 경우가 많다.

빅데이터의 기본은 데이터이며, 빅데이터 분석이 데이터 확보가 쉬운 소셜 데이터의 분석으로 이어지는 것은 당연한 결과일 수도 있다.

그러나 이러한 데이터들은 대부분이 자연어 데이터, 비정형 데이터들이 많으며 전체 데이터의 신뢰도를 떨어뜨릴 수 있다.

그러므로 데이터의 신뢰도를 높이는 것이 중요하기 때문에 적어도 이 데이터의 출처를 쉽게 파악할 수 있다면 데이터의 활용에 있어 어느 정도의 신뢰성이 보장된 데이터인가를 분석할 수 있을 것이며, 문제가 되는 데이터에 대해서는 조치를 취할 수 있을 것이다.

다른 하나는 개인정보 보호 측면에서이다. 정보주체가 다수의 인터넷 서비스를 이용함에 따라 제공한 본인의 개인정보가 어느 곳으로 유통되고 있는지에 대해서 확인이 어려워지고 있다.

정보 주체자신도 본인의 정보가 어디에 어떻게 쓰이는지 알 수 없을 뿐만 아니라, 정보를 이용하는 서비스 제공자 측면에서도 이 정보를 사용하는 것이 정책에 위배되지 않는지 알기 어렵다.
 
내가 언제 어느 사이트에서 내 정보를 제공했는지 알기 어렵기 때문에 정보를 일일이 찾아서 삭제하는 것은 사실상 불가능한 일이다.

정보의 추적성이 확보된다면 내 정보가 어디에서 어떻게 쓰이고 있는지 알 수 있을 것이며, 기업 입장에서도 이 정보가 누구에 의해 어떻게 생성이 됐고, 정보를 이용함에 있어 중요 정보가 포함이 되어 있는지, 그리고 어느 수준까지 동의를 받았는지 알 수 있게 된다.

그러므로 빅데이터 환경에서의 정보 추적성은 매우 중요한데, 빅데이터 환경에서는 대량의 데이터가 관리됨에 따라 제도적인 방법과 기술적인 방법 모두 함께 이루어져야 할 것이다.


‘마이너리티 리포트’ 현실화 될까?

빅데이터를 가진 조직은 다른 개인의 사생활에 대
해 우리가 상상하는 것 이상으로 파악할 수 있게
된다. 할리우드 영화 ‘마이너리티 리포트’ 같은 시대
가 조만간 도래할 수도 있는 것이다. 부작용인 빅브
라더의 탄생을 막고 빅데이터에서 얻을 수 있는 효
율을 극대화하기 위해서는 개인정보에 대한 인식을
새롭게 해야 한다.

방송에서 쉽게 접할 수 있는 “빅
데이터 분석을 통한 맞춤형 서비스 제공”이라는 말
의 이면에는 생각지도 못한 많은 개인정보가 필요
하다는 것을 인식하고, 빅데이터와 프라이버시라는
두 마리 토끼를 잡기 위해서는 기업뿐만 아니라 정
보 주체 자신도 노력해야 한다.

홍승필
성신여대 IT학부 교수



참고문헌

2015년 빅데이터 글로벌 사례집, 미래창조과학부, 2015.05

Chosun Biz, “빅데이터 이야기-미국의 프리즘 파문과 빅브라더 공포”, 2015.11.6. http://biz.chosun.com/site/data/html_dir/2013/07/04/2013070401864.html

디지털타임스, “이근형 칼럼-빅데이터가 답인가”, 2013.09.22. http://www.dt.co.kr/contents.html?article_no=2013092302012251661004

빅데이터 확산에 따른 보안 및 프라이버시 보호 체계 강화방안 연구, 한국인터넷진흥원, 2013.12


Posted by 미디어정보팀

댓글을 달아 주세요