[오늘의 공부] 데이터 마이닝

in #kr7 years ago (edited)

데이터베이스 가운데 데이터 마이닝이라는 분야가 있다.

그중 clasification 은 데이터를 속성에 따라 분류하는 것이고,

clustering 은 유사한 데이터들을 군집화하는 것이다.

그리고 assocation rule (데이터 연관 규칙)은 데이터들 간의 연관규칙을 찾아내는 것이다.

예를 들면 대형 마트에서 사람들이 우유와 식빵을 동시에 구입할 확률이라던거,

인터넷 몰에서 영양팩을 사는 사람의 몇 퍼센트가 립스틱을 함께 구입하는 가를 알아내는 것,

유트브 서비스에서 어떤 동영상을 본 사람이 다른 관련 동영상으 볼 확률이라던가 등

assocation rule 은 다양한 분야에서 사용된다.



여기서 우리는 암호화된 데이터를 가지고 암호화된 데이터를 1)복호화 하지 않고

암호화된 데이터 상에서 assocation rule 을 알아내는 것이다.

이것이 활성화되면 마트에 있는 데이터를 암호화하여 안전하게 보관하면서도,

우리가 필요한 데이터 연관 규칙을 찾아낼 수 있다.

이 기술은 앞으로 클라우드 서비스의 핵심 기술이 될 것이다.

왜냐하면 클라우드 서비스가 기업에서 활성화가 늦어지는 이유는

기업이 보유한 데이터가 클라우드를 통해 유츌되는 염려 때문이다.


따라서 이러한 암호화된 데이터 상태에서의 데이터 마이닝 및 필요한 데이터 처리가

최근의 중요한 연구 주제이다.

두 줄 요약:데이터들의 관련성에대한 연구는 이미 되어있지만,
암호화된 데이터들의 관련성에대한 연구는 클라우드기술에 꼭 필요해서 연구주제로 쓸듯하다.

공부 끗 :)


  1. 복호화또는 디코딩은 부호화된 정보를 부호화되기 전으로 되돌리는 처리 혹은 그 처리 방식을 말한다. 보통은 부호화의 절차를 역으로 수행하면 복호화가 된다. 한편 복호기 또는 디코더는 복호화를 수행하는 장치나 회로, 컴퓨터 소프트웨어, 알고리즘 또는 사람을 말한다.