“빅데이터 핵심은 ‘데이터간 상관관계’”
상태바
“빅데이터 핵심은 ‘데이터간 상관관계’”
  • 데이터넷
  • 승인 2019.04.18 10:39
  • 댓글 0
이 기사를 공유합니다

강철순 비트나인 대표 “데이터간 관계 파악 위한 DB 구조화 필요”
▲ 강철순 비트나인 대표이사

지난 10여년간 스마트폰에서 IoT의 출연에 이르기까지, 현대 사회의 발전은 대량의 데이터를 끊임없이 생산하고 소비하는 다수의 사용자와 디바이스로 인해 상상을 초월하는 데이터 빅뱅의 시대를 맞으며 빅데이터 시대가 이미 시작됐다.

빅데이터, 데이터 네트워크 통한 통찰력 중요
빅데이터는 2012년 세계경제포럼에서 발표한 10대 신기술 중 첫 번째로 선정되며, 기업들에게 데이터의 가치와 중요성을 인식하게 했다. 이후 많은 기업들이 빅데이터 시스템을 구축하고 방대한 양의 데이터를 수집·관리하고 있으며 이를 분석해 의사결정, 비즈니스 모델 확장 등에 필요한 정보를 도출하기 위해 많은 비용과 시간을 투자하고 있다.

뿐만 아니라 데이터 처리 및 분석 기술의 발달로 빅데이터 활용 분야가 다양해지고 있으며, 4차 산업혁명으로 다양한 분야가 융합되면서 데이터간의 연결을 통한 통합 분석이 중요해지고 있다.

현대는 모든 것이 연결되는 초연결 사회로, 이러한 연결은 더욱 견고해지고 있다. 따라서 지금까지는 데이터의 안정적인 관리가 핵심이었다면 최근에는 데이터간 초연결을 통한 통찰력을 발견하는 것이 중요한 사회로 변화의 흐름이 가속화되고 있다.

가트너의 2019년 10대 데이터 및 분석 기술 트렌드에 따르면 데이터간 상관관계를 보다 쉽고 빠르게 파악하기 위한 ‘그래프 분석’이 중요한 트렌드로 제시되고 있다.

그래프 분석은 조직, 사람, 거래 등 이해 주체간의 관계를 탐색할 수 있는 기법이다. 이를 가능하게 하는 그래프 처리 애플리케이션과 그래프 데이터베이스 관리 시스템은 2022년까지 매년 100%씩 성장해 더욱 복잡하고 적응력이 뛰어난 데이터 사이언스를 구현할 것으로 기대된다.

데이터간 관계 파악 위한 DB 구조화 필요
그래프 데이터베이스는 정형, 비정형 등 데이터 유형이 다양해지고 규모가 방대해짐에 따라 데이터간의 관계 분석과 효과적인 시각화를 위해 최근 가장 주목 받는 기술 중 하나다. 그래프 데이터는 수학적 그래프 이론에 토대를 두고 있는데, 개별 객체의 데이터를 나타내는 점(Node/Vertex), 객체간의 관계를 표시해 주는 관계 선(Edge/Relationship), 성격이 비슷한 객체들을 묶어주는 묶음(Label)으로 구성된다.

이렇듯 데이터간의 관계를 기본 구조로 설정하고 있는 그래프 데이터베이스는 복잡하게 연결된 데이터를 효율적으로 모델링, 탐색 및 쿼리를 실행할 수 있어 조직, 사람 및 트랜잭션과 같은 관심있는 개별단위 객체(Entity)간의 관계를 탐색하고 분석하는 작업을 대폭 향상시킬 수 있다.

이러한 그래프 데이터베이스의 특징은 크게 3가지로 현실을 그대로 반영할 수 있는 직관적인 데이터 모델링, 스키마 유연성에 따른 손쉬운 데이터 관리, 관계 중심의 조회 방식에 따른 빠른 질의 처리 속도가 그것이다.

수집 및 관리하고 있는 빅데이터의 활용을 고민하거나 관계 중심의 분석 시스템 운영에 있어 성능의 한계를 느끼는 기업이라면 그래프 데이터베이스 시스템이 효과적인 대안이 될 수 있다. 빅데이터의 실질적인 가치 활용을 위해서는 이제 현실적인 준비를 검토해야 할 시점이다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.