본문 바로가기

Data

(4)
DB - 04 MongoDB 앞으로 아래의 기준을 가지고 몇 가지 Nosql 모델을 살펴볼 생각이다.1. 모델의 특징2. 분산처리에 강점이 있는 이유3. Data Quality 중 중요하게 생각하는 특성4. 사용 예시일단 Document-Oriented DataBase인 MongoDB에 대해서 알아보자.MongoDB의 특징 및 구조MongoDB는 Nosql중 현재 가장 많이 쓰는 데이터베이스로 Bson이라는 문서형식의 데이터를 저장한다.Bson(Binary Json)의 약자로 JSON 문서를 기계어에 가깝게 만들어 컴퓨터가 이해하기 쉽게 만든 문서이다.때문에 데이터를 빠르게 분석하고 의미를 이해할 수 있다.MongoDB는 RDBMS에서 Table과 같은 역할을 하는 Collection이 있다.예를 들어 User Tabel == Us..
DB - 03 Nosql (Not only SQL) Nosql이란?Nosql이란 RDBMS와는 완전 반대의 성격을 지닌 DBMS이다.Nosql은 동적 스키마, 대량의 분산데이터를 다루는 시스템을 지원하여 대용량 및 빠른 속도의 데이터 처리가 가능하다.물론 RDBMS도 현재는 클라우드 서비스를 이용하며 수평적 확장이 가능해져 대용량 서비스를 처리할 수 있게 되었다.하지만 이미지,영상과 같은 반정형, 비정형 데이터를 다루는데 있어서는 고정적인 스키마를 이용하는 RDBMS는 어려움이 존재한다.RDBMS의 이런 특징과 반대로 Nosql은 아주 유연한 스키마 구조를 가지고 있어 다양한 형태의 데이터를 다루는데 강점을 가지고 있다.Nosql은 데이터를 여러 노드에 분산시켜 저장하여, 단일 노드의 부담을 줄이고 데이터를 병렬로 처리할 수 있어 빅데이터 처리에 능하다...
DB - 02 RDBMS(Realation DBMS) RDBS란?RDBMS는 관계형 데이터베이스 시스템으로 데이터를 표 형태로 구조화하여 관리한다. 표 형태의 데이터 구조를 RDBMS에서는 TABLE이라 한다. 테이블은 속성과 그에 대응하는 데이터 값으로 이루어져 있다. 속성은 테이블에 담긴 데이터의 특징을 나타내고, 이를 통해 다른 테이블과 관계를 맺을 수 있다. 각 테이블의 열(column)은 Attribute or Field라 칭하고, 행(Row)는 Record, Tuple이라 한다.Schema란?Schema는 데이터베이스의 구조를 정의하는 설계도를 의미한다. 구체적으로 말하자면 테이블, 행, 열, 인덱스, 관계 등의 데이터베이스 구조를 정하는 것이다. 여기서 인덱스(Index)는 데이터베이스에서 데이터 검색의 속도를 빠르게 하기 위해 사용하는 객체로..
DB - 01 데이터베이스 기초 Database란?DataBase는데이터를 저장하고 조회하는 프로그램이다. 은행에서 고객의 정보를 담아두고 조회하고, 학교에서 학생들의 성적을 저장하고 조회하는 것처럼 일상에서 쉽게 접할 수 있다.DB의 사용 목적데이터를 저장하고 조회하는 것이 데이터베이스의 본질이다.그렇지만 우리가 보편적으로 사용하는 폴더를 이용한 파일 구조도 이러한 기능을 할 수 있는데 굳이 데이터베이스를 사용하는 이유가 있을까? 라는 의문이 들 수 있다. 사람들은 왜 데이터베이스를 쓰는 걸까?바로 데이터베이스의 데이터 관리 능력때문이다.데이터베이스는 SQL이라는 언어를 통해서 데이터를 사용자의 목적에 맞춰 디테일하게 제어하고 관리할 수 있다.데이터를 한 저장소에 통합하여 저장하여 목적에 맞는 데이터들을 효율적으로 관리할 수 있으며,..