빅데이터

빅데이터가 '하둡'을 찾는 까닭
‘빅데이터’ 시대를 연 공신은 여럿이다. 스마트폰 보급과 SNS 데이터의 폭발적인 증가, 새롭게 주목받고 있는 사물네트워크(M2M) 센서 데이터와 사물인터넷(IoT) 데이터의 확산 등이 그렇다.

빅데이터는 대개 전통적인 데이터베이스(DB)나 시스템 환경에서 처리하기 힘든 대용량 데이터를 저장, 분석, 처리해 가치있는 정보로 만들어내는 일련의 과정을 일컫는다. 뉴욕 증권거래소는 하루에만 1TB에 이르는 거래 데이터가 발생한다. 페이스북엔 30PB가 넘는 사진 DB가 쌓여 있다. 이들이 대용량 데이터를 처리하는 데는 공통점이 있다. 바로 ‘하둡(Hadoop)’을 이용해 처리한다는 점이다.

하둡은 국내외를 막론하고 빅데이터를 다루는 개발자들의 관심을 한몸에 받고 있다. 이들은 하둡 생태계를 통해 빅데이터를 보다 원활하고 효율적으로 분석할 수 있다고 입을 모은다. 이유가 뭘까.
빅데이터 처리 위해 태어난 분산시스템
빅데이터라는 개념이 등장하기 이전에도 대용량 데이터를 다루는 방법은 존재했다. 성능 좋고 값비싼 시스템도 있었고, 슈퍼컴퓨터를 이용해 큰 데이터를 처리하기도 했다. 하지만 기존 시스템 환경에는 한계가 분명했다. 기업은 중요하다고 판단되는 데이터만 분석하는 데 집중했다. 스토리지나 컴퓨팅 자원도 부족했고 비용도 적잖이 드는데다 관련 기술이나 엔지니어가 부족하다는 이유에서였다.

[네이버 지식백과] 하둡 [Hadoop] - 빅데이터가 '하둡'을 찾는 까닭 (용어로 보는 IT)... 더보기

[네이버 지식백과] 하둡 [Hadoop] - 빅데이터가 '하둡'을 찾는 까닭 (용어로 보는 IT)

terms.naver.com

하둡 프레임워크는 대용량 데이터를 값싸고 빠르게 분석할 수 있게 돕는다. 기존에는 슈퍼컴퓨터를 며칠씩 돌려야 했던 데이터도 하둡을 이용하면 x86 서버로 실시간 분석이 가능해졌다. 이런 장점들이 알려지며 하둡은 빅데이터 처리와 분석을 위한 플랫폼 시장에서 사실상 표준으로 자리잡기 시작했다. [네이버 지식백과] 하둡 [Hadoop] - 빅데이터가 '하둡'을 찾는 까닭 (용어로 보는 IT)

2017.04.20 16:57 ㆍ필승님 ㆍ댓글 ㆍ좋아요 ㆍ찜

IT트렌드를 읽다 02. 기업들은 왜 빅데이터를 원하는가?

m.post.naver.com

사람들의 마음을 읽을 수 있다. 왜 기업들은 ‘빅데이터’에 관심을 가지게 되었을까? 가장 큰 이유는 역시 ‘기술 발전’ 때문이다. 스마트폰이 대중화되면서 우리는 언제 어디서나 인터넷에 접속된 상태가 되었다. 그러다 보니 걷잡을 수 없을 만큼 많은 데이터를 생산하고 있다. 중국기업 ‘텐센트’가 18년 동안 축적해온 빅데이터의 규모는 세계 최대 도서관인 미국의회도서관 장서량의 1만 5천 배에 달한다고 한다. 이 정도의 양이면 데이터를 분석하는 것도 쉬운 일이 아닐 듯싶다.

2017.02.09 17:02 ㆍ필승님 ㆍ댓글 ㆍ좋아요 ㆍ찜

IT트렌드를 읽다 01. 빅데이터, 나보다 더 나를 잘 안다.

m.post.naver.com

빅데이터는 ‘흔적’이다. ‘사람은 누구나 흔적을 남긴다.’ 마치 범죄 수사물에서 형사가 담배를 질겅질겅 씹으며, 연기와 함께 내뱉을 것만 같은 대사다. 빅데이터를 네이버 지식백과에서 검색해 보면 ‘디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성주기도 짧고, 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다’라고 정의되어 있다. 꽤 복잡하다. 간단하게 빅데이터를 한마디로 정리하면 ‘흔적’이다. 이 흔적은 ‘사람’에 대한 것은 물론 ‘사물들의 흔적’까지 포함되는 넓은 개념이다.

2017.02.09 17:02 ㆍ필승님 ㆍ댓글 ㆍ좋아요 ㆍ찜