데이터베이스 소개

2022. 10. 3. 00:13데이터베이스(DB)

반응형

용어

데이터(data)

의미를 가지면서 기록될 수 있는 알려진 사실

데이터베이스(database)

- 관련 있는 데이터의 모임

● 데이터베이스 관리 시스템(DBMS)

- 데이터베이스의 생성과 관리를 담당하는 소프트웨어 패키지

● 데이터베이스 시스템 (database system)

- 데이터베이스와 데이터베이스를 관리하는 소프트웨어 (DBMS, 응용 프로그램) 모두를 칭하는 용어

● 작은 세계(mini-world)

- 데이터베이스 구축의 대상이 되는 실세계의 일부분

 

데이터베이스 시스템 환경

 

데이터베이스의 예

 

데이터베이스의 특징

데이터베이스 시스템의 자기 기술성 (self-describing)

- 데이터베이스 카탈로그(catalog)에는 메타 데이터(meta-data)가 저장되어 있으며, 이를 이용하여 하나의 DBMS가 다수의 데이터베이스를 관리할 수 있음.

메타 데이터(meta-data) : 데이터베이스에 대한 정보

메타 데이터 예시

 

● 프로그램과 데이터의 분리

- 데이터베이스 내의 데이터 저장 구조가 변경되어도 database 응용 프로그램은 영향을 받지 않는 (변경될 필요가 없는) 성질

- 프로그램과 데이터의 독립성(program-data independence)을 높임

● 데이터 추상화

데이터 모델(data model)을 사용함으로써 저장 구조의 자세한 내용은 사용자로부터 은닉시키고 개념적인 뷰(conceptual view)만을 제공

STUDENT 레코드에 대한 내부 저장 형식

 

데이터에 대한 다중 뷰(view) 제공

- 사용자는 전체 데이터베이스보다는 관심이 있는 데이터베이스의 일부를 뷰로 정의할 수 있음.

데이터의 공유와 다수 사용자 트랜잭션 처리

트랜잭션은 한 번 이상의 데이터베이스 접근을 포함하는 프로그램의 단위 혹은 프로세스 수행. 고립성과 원자성의 성질을 만족하여야 함.

동시성 제어 (Concurrency Control)

온라인 트랜잭션 처리 (OLTP : On-Line Transaction Processing)
- 다수 사용자를 위한 DB 프로그래밍 관점에서 트랜잭션에 대해 학습

데이터베이스에 대한 뷰 - 학생의 성적표 뷰
데이터베이스에 대한 뷰 - 과목의 선수과목 뷰

 

데이터베이스 사용자

데이터베이스 관리자(database administrator, DBA)

- 데이터베이스 시스템의 관리를 책임진 사람

데이터베이스 설계자(database designer)

- 데이터베이스의 설계를 책임진 사람

최종 사용자(end users)

- 데이터베이스에 대하여 질의, 갱신, 보고서 작성 등을 담당하는 사람

  ■ 캐주얼 사용자(casual end users)비정기적인 데이터베이스 사용자. Sql을 잘 다루어야 함.

  ■ 초보 사용자(parametric or naïve users) – 미리 일정한 용도로 작성된 프로그램을 사용하는 사용자; 은행 점원이나 여행사 예약 담당원 등

  ■ 전문 사용자(sophisticated end users) – 복잡한 응용을 개발하며, DBMS의 기능을 충분히 사용하는 전문가

시스템 분석가 / 응용 프로그래머(system analysts / application programmers)

- 초보 사용자를 위하여 잘 정의된 기능의 응용을 설계하고 구현하는 사람.

DBMS 설계 및 구현자

DBMS 소프트웨어 자체를 설계하고 구현하는 업무를 담당하는 사람들

● 도구 개발자

- 데이터베이스를 사용하는 데에 필요한 도구들 (데이터베이스 설계 및 구축 도구, 성능 도
구, 인터페이스 등)을 설계하고 구현하는 사람들

● 운영 및 유지 보수 요원

- 데이터베이스 시스템을 운영하는 데에 필요한 하드웨어 및 소프트웨어의 운영 및 유지보수 담당 요원들

 

DBMS 장점

중복성의 제어

데이터 일치성 (consistency) 보장 및 메모리 낭비 방지
다수 사용자 간의 데이터와 공유 및 동시 접근 보장

제어된 중복성

- 제어된 중복성 : 성능을 위하여 GRADE_REPORT 파일에 StudentName과 CourseNumber를 포함시키고, 두 속성의 값이 Student에서의 두 속성 값과 일치하도록 DBMS가 보장함.

비제어된 중복성

- 비 제어된 중복성 : STUDENT 레코드와 불일치하는 GRADE_REPORT 레코드의 예 (17번 학생은 Brown이 아니라 Smith임)

 

권한이 없는 접근의 통제

보안과 권한 서브시스템

● 프로그램 객체를 위한 지속성 기억 공간 제공

지속성 객체(Persistent Object)
Impedance Mismatch
  ■ 모델이 서로 다르면 모델 간의 impedance mismatch가 없다.

● 효율적인 질의 처리를 위한 저장 구조와 탐색 기법의 제공

● 백업과 회복 제공

● 다수의 사용자 인터페이스 제공

● 데이터 간의 복잡한 관계의 표현

무결성 제약 조건(Integrity constraint)의 시행

참조 무결성(Referential integrity)
비즈니스 규칙(Business rule)

규칙을 사용한 추론과 수행

연역(deductive) 데이터베이스 시스템
- 트리거(Trigger)

 

DBMS 사용 효과

표준화된 데이터 관리

- 조직 내 모든 부서에서 표준화된 문서 관리로 업무 효율성 증대

● 데이터 구조 변경에 융통성 부여

- 데이터베이스 내의 자료 구조가 어떠한 이유로 변경되어도 사용자에 대한 영향은 거의 없음

응용 프로그램의 개발 시간 단축

- 응용 프로그램의 상당한 부분을 DBMS가 처리함

● 항상 최신의 정보를 제공

- 사용자 중에서 한 사람의 갱신으로 나머지 사람은 즉시 변경된 값을 접근 가능

규모의 경제성(economics of scale)

- 부서마다 다른 방식으로 자료를 관리하는 것보다 통합 DB로 관리하는 것이 전체적인 관
점에서 저비용

 

데이터베이스 응용의 간략한 역사

● 계층 시스템과 네트워크 시스템을 이용한 초기의 데이터베이스 응용 개발

계층 모델과 망 모델 등은 60년대 중반부터 80년대까지 주류를 이루었고, 현재에도 종종
사용됨.

● 관계형 데이터베이스를 통한 데이터 추상화와 응용의 유연성 제공

관계형 모델은 70년대 소개 이후, IBM과 세계 각 대학에서 연구되고 검증되어 왔으며, 80
년대에 들어서 상용 DBMS가 등장함.

● 객체 지향 응용과 더욱 복잡한 데이터베이스에 대한 요구

OODBMS는 80년대에 소개되어 CAD와 같은 복잡한 데이터 처리 응용에 사용됨.

● 전자 상거래(E-Commerce)를 위해 XML을 사용하여 웹에서 데이터 교환

- HTML을 이용한 새 응용이 등장했으며, 최근에는 XML전자상거래를 위한 데이터 저장 및 자료 교환의 새로운 표준으로 자리 잡고 있음.

● 새로운 응용을 위한 데이터베이스 능력 확장 요구

- 과학 응용, 이미지, 오디오, 비디오 저장 관리, 시공간 데이터 관리 기술 등

 

Database를 사용하지 않아도 좋은 경우

● DBMS를 사용하면 비용이 높아짐.

높은 초기 투자 비용과 추가적인 하드웨어 필요함.
- 데이터의 보안, 동시성 제어, 회복, 무결성 조건 등의 기능이 필요하지 않은 응용 – 오버
헤드가 됨

● 언제 DBMS가 불필요한가?

- 데이터베이스와 응용이 단순하고 잘 정의되어 있으며, 변경될 가능성이 적을 경우
DBMS 오버헤드로 인하여 엄격한 실시간 데이터 처리 요구사항을 만족시키기 힘든 경우
(최근 들어 이러한 경우 실시간 DBMS 활용 가능)
많은 사용자 데이터 접근이 필요하지 않은 경우