[오늘의 공부] 데이터 마이닝
데이터베이스 가운데 데이터 마이닝이라는 분야가 있다.
그중 clasification 은 데이터를 속성에 따라 분류하는 것이고,
clustering 은 유사한 데이터들을 군집화하는 것이다.
그리고 assocation rule (데이터 연관 규칙)은 데이터들 간의 연관규칙을 찾아내는 것이다.
예를 들면 대형 마트에서 사람들이 우유와 식빵을 동시에 구입할 확률이라던거,
인터넷 몰에서 영양팩을 사는 사람의 몇 퍼센트가 립스틱을 함께 구입하는 가를 알아내는 것,
유트브 서비스에서 어떤 동영상을 본 사람이 다른 관련 동영상으 볼 확률이라던가 등
assocation rule 은 다양한 분야에서 사용된다.
여기서 우리는 암호화된 데이터를 가지고 암호화된 데이터를 1)복호화 하지 않고
암호화된 데이터 상에서 assocation rule 을 알아내는 것이다.
이것이 활성화되면 마트에 있는 데이터를 암호화하여 안전하게 보관하면서도,
우리가 필요한 데이터 연관 규칙을 찾아낼 수 있다.
이 기술은 앞으로 클라우드 서비스의 핵심 기술이 될 것이다.
왜냐하면 클라우드 서비스가 기업에서 활성화가 늦어지는 이유는
기업이 보유한 데이터가 클라우드를 통해 유츌되는 염려 때문이다.
따라서 이러한 암호화된 데이터 상태에서의 데이터 마이닝 및 필요한 데이터 처리가
최근의 중요한 연구 주제이다.
두 줄 요약:데이터들의 관련성에대한 연구는 이미 되어있지만,
암호화된 데이터들의 관련성에대한 연구는 클라우드기술에 꼭 필요해서 연구주제로 쓸듯하다.
공부 끗 :)
- 복호화또는 디코딩은 부호화된 정보를 부호화되기 전으로 되돌리는 처리 혹은 그 처리 방식을 말한다. 보통은 부호화의 절차를 역으로 수행하면 복호화가 된다. 한편 복호기 또는 디코더는 복호화를 수행하는 장치나 회로, 컴퓨터 소프트웨어, 알고리즘 또는 사람을 말한다.