23 분 소요

2021 시나공 정보처리기사 실기책 참고

주의! 중요도가 낮은 항목(C, D)은 일부 제외

1. 데이터베이스 개요 – A

  • 데이터들을 논리적인 구조로 조직화하거나, 물리적인 공간에 구축한 것
  • 논리 데이터저장소는 데이터 및 데이터 간의 연관성, 제약조건을 식별하여 논리적인 구조로 조직화한 것
  • 물리 데이터저장소는 논리 데이터저장소를 SW가 운용될 환경의 물리적 특성을 고려하여 실제 저장장치에 저장한 것

- 데이터베이스

  • 공동으로 사용될 데이터를 중복을 배제하여 통합하고, 저장장치에 저장하여 항상 사용할 수 있도록 운영하는 운영 데이터
  • 통합된 데이터 : 자료의 중복을 배제한 데이터의 모임
  • 저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장된 자료
  • 운영 데이터 : 조직의 고유한 업무를 수행하는 데 반드시 필요한 자료
  • 공용 데이터 : 여러 응용 시스템들이 공동으로 소유하고 유지하는 자료

- DBMS(데이터베이스 관리 시스템)

  • 사용자의 요구에 따라 정보를 생성해주고, DB를 관리해주는 SW
  • 데이터의 종속성과 중복성의 문제를 해결하기 위해 제안된 시스템
  • 필수 기능
    • 정의 기능 : 데이터의 형과 구조에 대한 정의, 이용 방식, 제약 조건 등을 명시
    • 조작 기능 : 데이터 검색, 삽입, 삭제 등을 위해 인터페이스 수단을 제공
    • 제어 기능 : 데이터의 무결성, 보안, 권한 검사, 병행 제어를 제공

- 데이터의 독립성

  • 종속성에 대비되는 말
  • 논리적 독립성 : 응용 프로그램과 DB를 독립시킴으로써, 데이터의 논리적 구조를 변경시키더라도 응용 프로그램은 영향을 받지 않음
  • 물리적 독립성 : 응용 프로그램과 보조기억장치 같은 물리적 장치를 독립시킴으로써, 디스크를 추가/변경하더라도 응용 프로그램은 영향을 받지 않음

- 스키마

  • DB의 구조와 제약조건에 관한 전반적인 명세를 기술한 것
  • 외부 스키마
    • 각 개인의 입장에서 필요로 하는 DB의 논리적 구조를 정의한 것
  • 개념 스키마
    • DB의 전체적인 논리적 구조
    • 모든 응용 프로그램이나 사용자들이 필요로 하는 데이터를 종합한 조직 전체의 DB로 하나만 존재
  • 내부 스키마
    • 물리적 저장장치의 입장에서 본 DB 구조
    • 실제로 저장될 레코드의 형식, 저장 데이터 항목의 표현 방법, 내부 레코드의 물리적 순서 등을 나타냄


2. 데이터베이스 설계 – A

  • 사용자의 요구를 분석하여 그것들을 컴퓨터에 저장할 수 있는 DB 구조에 맞게 변형한 후, DBMS로 DB를 구현하여 일반 사용자들이 사용하게 하는 것

- 데이터베이스 설계 시 고려사항

  • 무결성 : 연산 후에도 DB에 저장된 데이터가 정해진 제약 조건을 항상 만족
  • 일관성 : 특정 질의에 대한 응답이 처음부터 끝까지 일정해야 함
  • 회복 : 장애가 발생했을 때 장애 발생 직전의 상태로 복구할 수 있어야 함
  • 보안 : 불법적인 데이터의 노출 또는 변경이나 손실로부터 보호할 수 있어야 함
  • 효율성 : 응답시간의 단축, 시스템의 생산성, 저장 공간의 최적화 등 가능해야 함
  • 데이터베이스 확장 : 운영에 영향을 주지 않으면서 지속적으로 데이터를 추가할 수 있어야 함

- 데이터베이스 설계 순서

  • 요구 조건 분석 -> 개념적 설계 -> 논리적 설계 -> 물리적 설계 -> 구현

- 요구 조건 분석

  • DB를 사용할 사람들로부터 필요한 용도를 파악하는 것
  • 요구 조건 명세서 작성

- 개념적 설계(정보 모델링, 개념화)

  • 현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
  • 개념 스키마 모델링과 트랜잭션 모델링을 병행 수행
  • 요구 조건 명세를 DBMS에 독립적인 E-R 다이어그램으로 작성
  • DBMS에 독립적인 개념 스키마를 설계

- 논리적 설계(데이터 모델링)

  • 현실 세계에서 발생하는 자료를 특정 DBMS가 지원하는 논리적 자료 구조로 변환시키는 과정
  • 논리적 구조의 데이터로 모델화
  • 개념 스키마를 평가 및 정제하고 DBMS에 따라 서로 다른 논리적 스키마를 설계
  • 트랜잭션의 인터페이스를 설계

- 물리적 설계(데이터 구조화)

  • 논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정
  • DB 파일의 저장 구조 및 액세스 경로를 결정
  • 데이터가 컴퓨터에 저장되는 방법을 묘사

- 데이터베이스 구현

  • 논리적 설계와 물리적 설계에서 도출된 DB 스키마를 파일로 생성하는 과정
  • 응용 프로그램을 위한 트랜잭션을 작성
  • DB 접근을 위한 응용 프로그램을 작성


3. 데이터 모델의 개념 – B

  • 현실 세계의 정보들을 단순화, 추상화하여 체계적으로 표현한 개념적 모형
  • 개념적 도구들로 구성
  • 데이터의 구조를 논리적으로 표현하기 위해 지능적 도구로 사용됨
  • 구성 요소 : 개체, 속성, 관계
  • 종류 : 개념적 데이터 모델, 논리적 데이터 모델, 물리적 데이터 모델
  • 표시할 요소 : 구조, 연산, 제약 조건

- 개념적 데이터 모델

  • 현실 세계에 대한 인간의 이해를 돕기 위해 현실 세계에 대한 인식을 추상적 개념으로 표현
  • 정보 모델이라고도 함
  • E-R 모델

- 논리적 데이터 모델

  • 개념적 구조를 컴퓨터 세계의 환경에 맞도록 변환하는 과정
  • 특정 DBMS는 특정 논리적 데이터 모델 하나만 선정하여 사용
  • 관계 모델, 계층 모델, 네트워크 모델로 구분

- 데이터 모델에 표시할 요소

  • 구조 : 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질 표현
  • 연산 : 실제 데이터를 처리하는 작업에 대한 명세로서 DB를 조작하는 기본 도구
  • 제약 조건 : DB에 저장될 수 있는 실제 데이터의 논리적인 제약 조건


4. 데이터 모델의 구성 요소 – B

- 개체

  • DB에 표현하려는 것으로, 개념이나 정보 단위 같은 현실 세계의 대상체
  • 독립적으로 존재하거나 그 자체로서도 구별이 가능, 유일한 식별자에 의해 식별됨
  • 다른 개체와 하나 이상의 관계가 있음
  • 구성 요소
    • 속성 : 개체가 가지고 있는 특성
    • 개체 타입 : 속성으로만 기술된 개체의 정의
    • 개체 인스턴스 : 개체를 구성하고 있는 각 속성들이 값을 가져 하나의 개체를 나타내는 것
    • 개체 세트 : 개체 인스턴스의 집합

- 속성

  • DB를 구성하는 가장 작은 논리적 단위
  • 파일 구조상의 데이터 항목 또는 데이터 필드에 해당
  • 개체를 구성하는 항목으로 개체의 특성을 기술
  • 속성의 수를 디그리 또는 차수라고 함
  • 속성은 속성의 특성과 개체 구성 방식에 따라 분류

- 속성의 특성에 따른 분류

  • 기본 속성
    • 업무 분석을 통해 정의한 속성
    • 가장 많고 일반적
    • 업무상 코드로 정의한 속성은 기본 속성에서 제외됨
  • 설계 속성
    • 설계 과정에서 도출해내는 속성
    • 업무를 규칙화하려고 속성을 새로 만들거나 변형하여 정의하는 속성
  • 파생 속성
    • 다른 속성으로부터 계산이나 변형 등의 영향을 받아 발생하는 속성
    • 되도록 적은 수를 정의하는 것이 좋음

- 속성의 개체 구성 방식에 따른 분류

  • 기본키 속성 : 개체를 유일하게 식별할 수 있는 속성
  • 외래키 속성 : 다른 개체와의 관계에서 포함된 속성
  • 일반 속성 : 개체에 포함되어 있고 기본키, 외래키에 포함되지 않은 속성

- 관계

  • 개체와 개체 사이의 논리적인 연결
  • 개체 간의 관계와 속성 간의 관계가 있음

- 관계의 형태

  • 일 대 일(1:1) : A의 각 원소가 B의 원소 한 개와 대응하는 관계
  • 일 대 다(1:N) : A의 각 원소는 B의 원소 여러 개와 대응, B의 각 원소는 A의 원소 한 개와 대응하는 관계
  • 다 대 다(N:M) : A의 각 원소는 B의 원소 여러 개와 대응, B의 각 원소도 A의 원소 여러 개와 대응하는 관계

- 관계의 종류

  • 종속 관계
    • 두 개체 사이의 주종 관계를 표현한 것
    • 식별 관계와 비식별 관계가 있음
  • 중복 관계
    • 두 개체 사이에 2번 이상의 종속 관계가 발생하는 관계
  • 재귀 관계
    • 개체가 자기 자신과 관계를 갖는 것
    • 순한 관계라고도 함
  • 배타 관계
    • 개체의 속성이나 구분자를 기준으로 개체의 특성을 분할하는 관계
    • 배타 AND 관계나 배타 OR 관계로 구분


5. E-R 모델 – A

  • 현실 세계의 무질서한 데이터를 개념적인 논리 데이터로 표현하기 위한 방법
  • 개념적 데이터 모델의 가장 대표적인 것
  • 개체 타입과 관계 타입을 이용해 현실 세계를 개념적으로 표현
  • 데이터를 개체, 관계, 속성으로 묘사
  • 1:1, 1:N, N:M 등의 관계 유형을 제한 없이 나타낼 수 있음

- E-R 다이어그램

  • 사각형 : 개체 타입
  • 마름모 : 관계 타입
  • 타원 : 속성
  • 이중 타원 : 다중값 속성(복합 속성)
  • 밑줄 타원 : 기본키 속성
  • 복수 타원 : 복합 속성
  • 관계 : 1:1, 1:N, N:M 등의 개체 간 관계에 대한 대응수를 선 위에 기술
  • 선, 링크 : 개체 타입과 속성을 연결


6. 관계형 데이터베이스의 구조 / 관계형 데이터 모델 – A

  • 2차원적인 표를 이용해서 데이터 상호 관계를 정의하는 DB
  • 개체와 관계를 모두 릴레이션이라는 표로 표현
  • 개체 릴레이션과 관계 릴레이션이 존재
  • 장점 : 간결하고 보기 편리하며, 다른 DB로의 변환이 용이
  • 단점 : 성능이 다소 떨어짐

- 관계형 데이터베이스의 릴레이션 구조

  • 릴레이션은 데이터들을 표의 형태로 표현한 것
  • 구조를 나타내는 릴레이션 스키마와 실제 값들인 릴레이션 인스턴스로 구성

- 튜플

  • 릴레이션을 구성하는 각각의 행
  • 속성의 모임으로 구성
  • 파일 구조에서 레코드와 같은 의미
  • 튜플의 수를 카디널리티 또는 기수, 대응수라고 함

- 속성

  • DB를 구성하는 가장 작은 논리적 단위
  • 파일 구조상의 데이터 항목 또는 데이터 필드에 해당
  • 개체의 특성을 기술
  • 속성의 수를 디그리 또는 차수라고 함

- 도메인

  • 하나의 애트리뷰트가 취할 수 있는 같은 타입의 원자값들의 집합

- 릴레이션의 특징

  • 릴레이션에 포함된 튜플들은 모두 상이함
  • 튜플 사이에는 순서가 없음
  • 릴레이션은 시간에 따라 변함
  • 속성들 간의 순서는 중요하지 않음
  • 속성의 명칭은 유일해야 하지만, 값은 동일한 값이 있을 수 있음
  • 튜플을 유일하게 식별하기 위해 속성들의 부분집합을 키로 설정
  • 속성의 값은 논리적으로 더 이상 쪼갤 수 없는 원자값만을 저장

- 관계형 데이터 모델

  • 2차원적인 표를 이용해서 데이터 상호 관계를 정의하는 DB 구조
  • 가장 널리 사용되는 데이터 모델
  • 속성들 간의 관계를 설정하거나 테이블 간의 관계를 설정하여 이용
  • 기본키와 이를 참조하는 외래키로 데이터 간의 관계를 표현
  • 계층 모델과 망 모델의 복잡한 구조를 단순화시킨 모델
  • 대표적인 언어는 SQL
  • 1:1, 1:N, N:M 관계를 자유롭게 표현할 수 있음


7. 관계형 데이터베이스의 제약 조건 - 키 – A

- 키

  • 조건을 만족하는 튜플을 찾거나 순서대로 정렬할 때 기준이 되는 속성
  • 후보키, 기본키, 대체키, 슈퍼키, 외래키

- 후보키

  • 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합
  • 기본키로 사용할 수 있는 속성들
  • 유일성과 최소성을 모두 만족시켜야 함
  • 유일성 : 하나의 키 값으로 하나의 튜플만을 유일하게 식별할 수 있어야 함
  • 최소성 : 속성 하나를 제거하면 유일하게 식별할 수 없도록 꼭 필요한 최소의 속성으로 구성

- 기본키

  • 후보키 중에서 특별히 선정된 주키
  • 중복된 값을 가질 수 없음
  • 한 릴레이션에서 특정 튜플을 유일하게 구별할 수 있는 속성
  • NULL 값을 가질 수 없음

- 대체키

  • 후보키가 둘 이상일 때 기본키를 제외한 나머지 후보키
  • 보조키라고도 함

- 슈퍼키

  • 속성들의 집합으로 구성된 키
  • 슈퍼키로 구성된 속성의 집합과 동일한 값은 나타나지 않음
  • 유일성은 만족하지만, 최소성은 만족하지 못함

- 외래키

  • 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합
  • 참조 릴레이션의 기본키에 없는 값은 입력할 수 없음


8. 관계형 데이터베이스의 제약 조건 - 무결성 – A

- 무결성

  • DB에 저장된 데이터 값과 현실 세계의 실제값이 일치하는 정확성
  • 부정확한 자료가 DB 내에 저장되는 것을 방지하기 위한 제약 조건

- 무결성의 종류

  • 개체 무결성 : 기본키를 구성하는 어떤 속성도 NULL 값이나 중복값을 가질 수 없음
  • 참조 무결성 : 외래키 값은 NULL이거나 참조 릴레이션의 기본키 값과 동일해야 함. 즉 참조할 수 없는 외래키 값을 가질 수 없음
  • 도메인 무결성 : 주어진 속성 값이 정의된 도메인에 속한 값이어야 함
  • 사용자 정의 무결성 : 사용자가 정의한 제약조건에 만족되어야 함
  • NULL 무결성 : 특정 속성 값이 NULL이 될 수 없도록 하는 규정
  • 고유 무결성 : 특정 속성에 대해 각 튜플이 갖는 속성값들이 서로 달라야 함
  • 키 무결성 : 하나의 릴레이션에는 적어도 하나의 키가 존재해야 함
  • 관계 무결성 : 한 튜플의 삽입 가능 여부 또는 한 릴레이션과 다른 릴레이션의 튜플들 사이의 관계에 대한 적절성 여부를 지정한 규정

- 데이터 무결성 강화

  • 데이터 품질에 직접적인 영향을 미치므로 데이터 특성에 맞는 적절한 무결성을 정의하고 강화해야 함
  • 애플리케이션, 데이터베이스 트리거, 제약 조건을 이용하여 강화할 수 있음
  • 애플리케이션 : 생성, 수정, 삭제 시 무결성 조건을 검증하는 코드를 프로그램 내에 추가
  • 데이터베이스 트리거 : 트리거 이벤트에 무결성 조건을 실행하는 절차형 SQL을 추가
  • 제약 조건 : DB에 제약 조건을 설정하여 무결성을 유지


9. 관계대수 및 관계해석 – A

- 관계대수

  • 원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적인 언어
  • 연산자와 연산규칙을 제공하며, 피연산자와 연산 결과가 모두 릴레이션
  • 수행해야 할 연산의 순서를 명시
  • 순수 관계 연산자와 일반 집합 연산자가 있음

- 순수 관계 연산자

  • Select
    • 선택 조건을 만족하는 튜플의 부분집합을 구하여 새로운 릴레이션을 만드는 연산
    • 수평연산
    • 시그마(σ)
  • Project
    • 속성 리스트에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만드는 연산
    • 수직연산
    • 중복이 발생하면 중복이 제거됨
    • 파이(π)
  • Join
    • 공통 속성을 중심으로 두 개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만드는 연산
    • Join의 결과는 Cartesian Product(교차곱)을 수행한 다음 Select를 수행한 것과 같음
    • ▷◁
  • Division
    • X ⊃ Y인 두 개의 릴레이션 R(X), S(Y)가 있을 때, S가 가진 속성을 제외한 속성만을 구하는 연산
    • ÷

- 일반 집합 연산자

  • 수학적 집합 이론에서 사용하는 연산자
  • 합집합, 교집합, 차집합을 처리하기 위해서는 합병 조건을 만족해야 함
  • UNION ∪ : 합집합
  • INTERSECTION ∩ : 교집합
  • DIFFERENCE - : 차집합
  • CARTESIAN PRODUCT X : 교차곱

- 관계해석

  • 관계 데이터의 연산을 표현하는 방법
  • 수학의 Predicate Calculus(술어 해석)에 기반
  • 비절차적 특성
  • 계산 수식을 사용


10. 이상 / 함수적 종속 – B

- 이상

  • 테이블에서 데이터의 중복이 발생하고, 이 중복으로 인해 문제가 발생하는 현상
  • 삽입 이상 : 데이터를 삽입할 때 의도와는 상관없이 원하지 않은 값들로 인해 삽입할 수 없게 되는 현상
  • 삭제 이상 : 튜플을 삭제할 때 의도와는 상관없는 값들도 함께 삭제되는 현상
  • 갱신 이상 : 튜플에 있는 속성 값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 불일치성이 생기는 현상

- 함수적 종속

  • 속성 X의 값 각각에 대해 항상 속성 Y의 값이 오직 하나만 연관되어 있을 때 Y는 X에 함수적 종속이라고 함
  • X -> Y로 표기
  • DB에서 항상 유지되어야 할 조건
  • 완전 함수적 종속
  • 부분 함수적 종속


11. 정규화 – A

  • 테이블의 속성들이 상호 종속적인 관계를 갖는 특성을 이용하여 테이블을 무손실 분해하는 과정
  • 중복을 제거하여 삽입, 삭제, 갱신 이상의 발생 가능성을 줄이는 것

- 정규화 과정

  • 제 1정규형
    • 도메인이 원자 값만으로 되어 있는 정규형
    • 도메인이 원자값
  • 제 2정규형
    • 기본키가 아닌 모든 속성이 기본키에 대하여 완전 함수적 종속을 만족하는 정규형
    • 부분적 함수 종속 제거
  • 제 3정규형
    • 이행적 함수적 종속을 만족하지 않는 정규형
    • 이행적 함수 종속 제거
  • BCNF
    • 모든 결정자가 후보키인 정규형
    • 결정자이면서 후보키가 아닌 것 제거
  • 제 4정규형
    • 다중 값 종속
    • 다치 종속 제거
  • 제 5정규형
    • 조인 종속
    • 조인 종속성 이용


12. 반정규화 – A

  • 정규화된 데이터 모델을 의도적으로 통합, 중복, 분리하여 정규화 원칙을 위배하는 행위
  • 시스템의 성능이 향상되고 관리 효율성 증가
  • 데이터의 일관성 및 정합성이 저하될 수 있음
  • 과도한 반정규화는 오히려 성능을 저하시킬 수 있음
  • 방법
    • 테이블 통합
    • 테이블 분할
    • 중복 테이블 추가
    • 중복 속성 추가

- 테이블 통합

  • 두 개의 테이블이 조인되어 사용되는 경우가 많을 경우 성능 향상을 위해 아예 하나의 테이블로 만들어 사용
  • 테이블 통합을 고려하는 경우
    • 두 개의 테이블에서 발생하는 프로세스가 동일하게 자주 처리되는 경우
    • 항상 두 개의 테이블을 이용하여 조회를 수행하는 경우
  • 테이블 통합의 종류
    • 1:1 관계 테이블 통합
    • 1:N 관계 테이블 통합
    • 슈퍼타입/서브타입 테이블 통합

- 테이블 분할

  • 테이블을 수직 또는 수평으로 분할하는 것
  • 수평 분할
    • 레코드를 기준으로 테이블을 분할하는 것
    • 레코드별로 사용 빈도의 차이가 큰 경우 사용 빈도에 따라 테이블을 분할
  • 수직 분할
    • 하나의 테이블에 속성이 너무 많을 경우 속성을 기준으로 테이블을 분할
    • 갱신 위주의 속성 분할, 자주 조회되는 속성 분할, 크기가 큰 속성 분할, 보안을 적용해야 하는 속성 분할

- 중복 테이블 추가

  • 작업의 효율성을 향상키기기 위해 테이블을 추가하는 것
  • 중복 테이블을 추가하는 경우
    • 여러 테이블에서 데이터를 추출해서 사용해야 할 경우
    • 다른 서버에 저장된 테이블을 이용해야 하는 경우
  • 방법
    • 집계 테이블의 추가
    • 진행 테이블의 추가
    • 특정 부분만을 포함하는 테이블의 추가

- 중복 속성 추가

  • 조인해서 데이터를 처리할 때 데이터를 조회하는 경로를 단축하기 위해 자주 사용하는 속성을 하나 더 추가하는 것
  • 데이터의 무결성 확보가 어렵고, 디스크 공간이 추가로 필요
  • 중복 속성을 추가하는 경우
    • 조인이 자주 발생하는 속성인 경우
    • 접근 경로가 복잡한 속성인 경우
    • 액세스의 조건으로 자주 사용되는 속성인 경우
    • 기본키의 형태가 적절하지 않거나 여러 개의 속성으로 구성된 경우


13. 시스템 카탈로그 – B

  • 다양한 객체에 관한 정보를 포함하는 시스템 DB
  • 사용자를 포함하여 DBMS에서 지원하는 모든 데이터 객체에 대한 정의나 명세에 관한 정보를 유지 관리하는 시스템 테이블
  • 카탈로그들이 생성되면 데이터 사전에 저장

- 메타 데이터

  • 시스템 카탈로그에 저장된 정보

- 데이터 디렉터리

  • 데이터 사전에 수록된 데이터에 접근하는 데 필요한 정보를 유지 관리하는 시스템
  • 시스템 카탈로그는 사용자와 시스템 모두 접근할 수 있지만, 데이터 디렉터리는 시스템만 접근할 수 있음


14. 트랜잭션 분석 / CRUD 분석 – A

- 트랜잭션

  • 논리적 기능을 수행하기 위한 작업의 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산
  • 병행 제어 및 회복 작업 시 처리되는 작업의 논리적 단위로 사용
  • 시스템이 응답하기 위한 상태 변환 과정의 작업 단위로 사용

- 트랜잭션의 특성

  • Atomicity(원자성) : 트랜잭션의 연산은 DB에 모두 반영되도록 Commit되던지 전혀 반영되지 않도록 Rollback 되어야 함
  • Consistency(일관성) : 트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 DB 상태로 변환
  • Isolation(독립성, 격리성, 순차성) : 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행중에 다른 트랜잭션의 연산이 끼어들 수 없음
  • Durability(영속성, 지속성) : 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장나더라도 영구적으로 반영

- CRUD 분석

  • 프로세스와 테이블 간에 CRUD 매트릭스를 만들어서 트랜잭션을 분석하는 것
  • 많은 트랜잭션이 몰리는 테이블을 파악할 수 있어 디스크 구성 시 유용한 자료로 활용할 수 있음
  • CRUD 매트릭스
    • 행에는 프로세스, 열에는 테이블, 행과 열이 만나는 위치에는 프로세스가 테이블에 발생시키는 변화를 표시
    • 트랜잭션이 테이블에 수행하는 작업을 검증
    • C > D > U > R의 우선순위 적용

- 트랜잭션 분석

  • 테이블에 저장되는 데이터의 양을 유추하고 이를 근거로 DB의 용량 산정 및 구조의 최적화를 목적으로 함
  • 업무 개발 담당자가 수행
  • 과도하게 접근하는 테이블을 확인할 수 있음
  • 집중 접근 테이블을 여러 디스크에 분산 배치함으로써 디스크 입출력 향상을 통한 성능 향상을 가져올 수 있음
  • 트랜잭션 분석서 : 단위 프로세스와 CRUD 매트릭스를 이용하여 작성


15. 인덱스 – B

  • 데이터 레코드를 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터 구조
  • 물리적 구조에 접근하는 방법 제공
  • 파일의 레코드에 빠르게 액세스 할 수 있음
  • 삽입과 삭제가 수시로 일어나는 경우에는 인덱스의 개수를 최소로 하는 것이 효율적

- 인덱스의 종류

  • 트리 기반 인덱스 : 인덱스를 저장하는 블록들이 트리 구조를 이루고 있는 것
  • 비트맵 인덱스 : 인덱스 컬럼의 데이터를 Bit 값인 0 또는 1로 변환하여 인덱스 키로 사용하는 방법
  • 함수 기반 인덱스 : 컬럼에 특정 함수나 수식을 적용하여 산출된 값을 사용하는 것
  • 비트맵 조인 인덱스 : 다수의 조인된 객체로 구성되 인덱스
  • 도메인 인덱스 : 개발자가 필요한 인덱스를 직접 만들어 사용하는 것

- 클러스터드/넌클러스터드 인덱스

  • 클러스터드 인덱스
    • 인덱스 키의 순서에 따라 데이터가 정렬되어 저장되는 방식
    • 데이터가 순서대로 저장되어 있어 인덱스를 검색하지 않아도 원하는 데이터를 빠르게 찾을 수 있음
  • 넌클러스터드 인덱스
    • 인덱스의 키 값만 정렬되어 있고 실제 데이터는 정렬되지 않는 방식
    • 데이터 삽입, 삭제 발생 시 순서를 유지하기 위해 데이터를 재정렬해야 함


16. 뷰 / 클러스터 – A

- 뷰

  • 접근이 허용된 자료만을 제한적으로 보여주기 위해 하나 이상의 기본 테이블로부터 유도된 가상 테이블
  • 저장장치 내에 물리적으로 존재하지 않지만, 있는 것처럼 간주
  • 뷰에 나타나지 않는 데이터를 안전하게 보호
  • 뷰가 정의된 기본 테이블이나 뷰를 삭제하면 그 테이블이나 뷰를 기초로 정의된 다른 뷰도 자동으로 삭제
  • 정의시 CREATE, 삭제시 DROP문 사용

- 뷰의 장단점

  • 장점
    • 논리적 데이터 독립성 제공
    • 동시에 여러 사용자의 상이한 응용이나 요구를 지원
    • 데이터 관리를 간단하게 해줌
    • 접근 제어를 통한 자동 보안 제공
  • 단점
    • 독립적인 인덱스를 가질 수 없음
    • 뷰의 정의를 변경할 수 없음
    • 뷰로 구성되 내용에 대한 삽입, 삭제, 갱신 연산에 제약이 따름

- 클러스터

  • 동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법
  • 데이터 조회 속도를 향상시키지만 입력, 수정, 삭제에 대한 작업 성능을 저하
  • 데이터의 분포도가 넓을수록 유리
  • 저장 공간을 절약할 수 있음
  • 처리 범위가 넓은 경우에는 단일 테이블 클러스터링 사용
  • 조인이 많이 발생하는 경우에는 다중 테이블 클러스터링 사용


17. 파티션 – B

  • 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것
  • 성능 저하 방지, 데이터 관리가 쉬워짐
  • 데이터 처리는 테이블 단위로, 데이터 저장은 파티션별로 수행

- 파티션의 장단점

  • 장점
    • 데이터 접근 시 액세스 범위를 줄여 쿼리 성능 향상
    • 디스크 성능 향상
    • 파티션별로 백업 및 복구를 수행하므로 속도가 빠름
    • 시스템 장애 시 데이터 손상 정도를 최소화할 수 있음
    • 데이터 가용성 향상
    • 파티션 단위로 입출력을 분산시킬 수 있음
  • 단점
    • 세심한 관리가 요구됨
    • 테이블간 조인에 대한 비용 증가
    • 용량이 작은 테이블에 파티셔닝을 수행하면 오히려 성능이 저하됨

- 파티션의 종류

  • 범위 분할
    • 지정한 열의 값을 기준으로 분할
  • 해시 분할
    • 해시 함수를 적용한 결과 값에 따라 데이터를 분할
    • 범위 분할의 단점을 보완한 것으로, 데이터를 고르게 분산할 때 유용
    • 특정 데이터가 어디에 있는지 판단할 수 없음
    • 데이터가 고른 컬럼에 효과적
  • 조합 분할
    • 범위 분할로 분할한 다음 해시 함수를 적용하여 다시 분할
    • 범위 분할한 파티션이 너무 커서 관리가 어려울 때 유용


18. 분산 데이터베이스 설계 – A

- 데이터베이스 용량 설계

  • 데이터가 저장될 공간을 정의하는 것
  • 테이블에 저장될 데이터양과 인덱스, 클러스터 등이 차지하는 공간 등을 예측하여 반영
  • 목적
    • 용량을 정확히 산정하여 디스크으 저장 공간을 효과적으로 사용하고 확장성 및 가용성을 높임
    • 디스크의 입출력 부하를 분산시키고 채널의 병목 현상을 최소화

- 분산 데이터베이스 설계

  • 논리적으로는 하나의 시스템에 속하지만 물리적으로는 네트워크를 통해 연결된 여러 개의 사이트에 분산된 데이터베이스
  • 데이터의 처리나 이용이 많은 지역에 DB를 위치시켜 데이터의 처리가 가능한 해당 지역에서 해결될 수 있도록 함
  • 애플리케이션이나 사용자가 분산되어 저장된 데이터에 접근하게 하는 것을 목적으로 함

- 분산 데이터베이스의 목표

  • 위치 투명성 : 액세스하려는 DB의 실제 위치를 알 필요 없이 단지 DB의 논리적인 명칭만으로 액세스할 수 있음
  • 중복 투명성 : 동일 데이터가 여러 곳에 중복되어 있더라도 사용자는 마치 하나의 데이터만 존재하는 것처럼 사용하고, 시스템은 자동으로 여러 자료에 대한 작업 수행
  • 병행 투명성 : 다수의 트랜잭션들이 동시에 실현되더라도 그 트랜잭션의 결과는 영향을 받지 않음
  • 장애 투명성 : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션을 정확하게 처리

- 분산 설계 방법

  • 테이블 위치 분산
    • 테이블을 각기 다른 서버에 분산시켜 배치
  • 분할
    • 데이터를 분할하여 분산
    • 규칙 : 완전성, 재구성, 상호 중첩 배제
    • 방법
      • 수평 분할
      • 수직 분할
  • 할당
    • 동일한 분할을 여러 개의 서버에 생성하는 분산 방법
    • 중복이 없는 할당과 중복이 있는 할당으로 나뉨


19. 데이터베이스 이중화 / 서버 클러스터링 – B

- 데이터베이스 이중화

  • 동일한 데이터베이스를 복제하여 관리하는 것
  • DB에 문제가 발생하면 복제된 DB를 이용하여 즉시 문제를 해결
  • 사용자가 수행하는 작업은 DB 이중화 시스템에 연결된 다른 DB에도 동일하게 적용
  • 분산 처리하므로, DB의 부하를 줄일 수 있음
  • 손쉽게 백업 서버를 운영할 수 있음

- 데이터베이스 이중화의 분류

  • Eager 기법
    • 트랜잭션 수행 중 데이터 변경이 발생하면 이중화된 모든 DB에 즉시 전달하여 변경 내용이 즉시 적용
  • Lazy 기법
    • 트랜잭션의 수행이 종료되면 변경 사실을 새로운 트랜잭션에 작성하여 각 DB에 전달되는 기법
    • DB마다 새로운 트랜잭션이 수행되는 것으로 간주

- 데이터베이스 이중화 구성 방법

  • 활동-대기 방법
    • 활성 DB에 장애가 발생하면 대기 상태에 있던 DB가 자동으로 모든 서비스를 대신 수행
    • 구성 방법과 관리가 쉬워 많은 기업에서 이용
  • 활동-활동 방법
    • 서로 다른 서비스를 제공하다가 둘 중 한쪽 DB에 문제가 발생하면 나머지 다른 DB가 서비스 제공
    • 처리율이 높지만 구성 방법 및 설정이 복잡

- 클러스터링

  • 두 대 이상의 서버를 하나의 서버처럼 운영하는 기술
  • 서버 이중화 및 공유 스토리지를 사용하여 서버의 고가용성을 제공
  • 종류
    • 고가용성 클러스터링
      • 하나의 서버에 장애가 발생하면 다른 노드가 받아 처리하여 서비스 중단을 방지
    • 병렬 처리 클러스터링
      • 전체 처리율을 높이기 위해 하나의 작업을 여러 개의 서버에서 분산하여 처리

- RTO/RPO

  • RTO(목표 복구 시간) : 업무 중단 시점으로부터 복구되어 가동될 때까지의 소요 시간
  • RPO(목표 복구 시점) : 데이터를 복구할 수 있는 기준점


20. 데이터베이스 보안 – B

  • DB의 일부 또는 전체에 대해서 권한이 없는 사용자가 액세스하는 것을 금지하기 위해 사용되는 기술

- 암호화

  • 데이터를 보낼 때 송신자가 지정한 수신자 이외에는 그 내용을 알 수 없도록 평문을 암호문으로 변환하는 것
  • 암호화 과정 : 평문을 암호문으로 바꿈
  • 복호화 과정 : 암호문을 평문으로 바꿈
  • 암호화 기법 : 개인키, 공개키 방식

- 접근 통제

  • 데이터가 저장된 객체와 이를 사용하려는 주체 사이의 정보 흐름을 제한
  • 접근통제 3요소
    • 접근통제 정책
    • 접근통제 메커니즘
    • 접근통제 보안모델
  • 접근통제 기술
    • 임의 접근통제(DAC)
      • 데이터에 접근하는 사용자의 신원에 따라 접근 권한을 부여
      • 데이터 소유자가 접근통제 권한을 지정하고 제어
      • 객체를 생성한 사용자가 객체에 대한 모든 권한을 부여받고, 권한을 다른 사용자에게 허가할 수 있음
    • 강제 접근통제(MAC)
      • 주체와 객체의 등급을 비교하여 접근 권한을 부여
      • 시스템이 접근통제 권한을 지정
      • DB 객체별로 보안 등급을 부여할 수 있음
      • 사용자별로 인가 등급을 부여할 수 있음
    • 역할기반 접근통제(RBAC)
      • 사용자의 역할에 따라 접근 권한을 부여
      • 중앙관리자가 접근통제 권한을 지정
      • 임의 접근통제와 강제 접근통제의 단점을 보완
      • 다중 프로그래밍 환경에 최적화

- 접근통제 정책

  • 어떤 주체가 언제, 어디서, 어떤 객체에게, 어떤 행위에 대한 허용 여부를 정의하는 것
  • 종류
    • 신분 기반 정책
      • 주체나 그룹의 신분에 근거하여 객체의 접근을 제한
      • IBP : 최소 권한 정책, 단일 주체에게 하나의 객체에 대한 허가 부여
      • GBP : 복수 주체에 하나의 객체에 대한 허가 부여
    • 규칙 기반 정책
      • 주체가 갖는 권한에 근거하여 객체의 접근을 제한하는 방법
      • MLP : 사용자나 객체별로 지정된 기밀 분류에 따른 정책
      • CBP : 집단별로 지정된 기밀 허가에 따른 정책
    • 역할 기반 정책
      • GBP의 변형된 정책
      • 주체의 신분이 아니라 주체가 맡은 역할에 근거하여 객체의 접근을 제한

- 접근통제 매커니즘

  • 정의된 접근통제 정책을 구현하는 기술적인 방법
  • 접근통제 목록, 능력 리스트, 보안 등급, 패스워드, 암호화 등

- 접근통제 보안 모델

  • 보안 정책을 구현하기 위한 정형화된 모델
  • 기밀성 모델
    • 군사적인 목적으로 개발된 최초의 수학적 모델
    • 기밀성 보장이 최우선
    • 군대 시스템 등 특수 환경에서 주로 사용
  • 무결성 모델
    • 불법적인 정보 변경을 방지하기 위해 무결성을 기반으로 개발된 모델
  • 접근통제 모델
    • 접근통제 메커니즘을 보안 모델로 발전시킨 것
    • 접근통제 행렬이 있음

- 접근통제 조건

  • 접근통제 매커니즘의 취약점을 보완하기 위해 접근통제 정책에 부가하여 적용할 수 있는 조건
  • 값 종속 통제 : 객체에 저장된 값에 따라 다르게 접근통제를 허용해야 하는 경우에 사용
  • 다중 사용자 통제 : 지정된 객체에 다수의 사용자가 동시에 접근을 요구하는 경우에 사용
  • 컨텍스트 기반 통제 : 특정 시간, 네트워크 주소, 접근 경로, 인증 수준 등에 근거하여 접근을 제어하는 방법. 보안 시스템의 취약점을 보완할 때 사용

- 감사 추적

  • 사용자나 애플리케이션이 DB에 접근하여 수행한 모든 활동을 기록하는 기능
  • 오류가 발생한 DB를 복구하거나 부적절한 데이터 조작을 파악하기 위해 사용


21. 스토리지 – B

  • 대용량의 데이터를 저장하기 위해 서버와 저장장치를 연결하는 기술
  • DAS, NAS, SAN

- DAS

  • 서버와 저장장치를 전용 케이블로 직접 연결하는 방식
  • 속도가 빠르고 설치 및 운영이 쉬움
  • 초기 구축 비용 및 유지보수 비용 저렴
  • 다른 서버에서 접근할 수 없고 파일을 공유할 수 없음
  • 확장성 및 유연성이 떨어짐

- NAS

  • 서버와 저장장치를 네트워크를 통해 연결하는 방식
  • NAS Storage가 내장된 저장장치를 직접 관리
  • Ethernet 스위치를 통해 다른 서버에서도 스토리지에 접근할 수 있어 파일 공유가 가능
  • 장소에 구애받지 않고 저장장치에 쉽게 접근
  • DAS에 비해 확장성 및 유연성이 우수

- SAN

  • DAS의 빠른 처리와 NAS의 파일 공유 장점을 혼합한 방식
  • 서버와 저장장치를 연결하는 전용 네트워크를 별도로 구성하는 방식
  • 파이버 채널 스위치를 이용하여 네트워크 구성
  • 처리 속도가 빠름
  • 서버들이 저장장치 및 파일을 공유할 수 있음
  • 확장성, 유연성, 가용성이 뛰어남


22. 자료 구조 – B

  • 자료를 기억장치의 공간 내에 저장하는 방법과 자료 간의 관계, 처리 방법 등을 연구 분석하는 것
  • 저장 공간의 효율성과 실행시간의 단축을 위해 사용
  • 분류
    • 선형 구조
      • 배열
      • 선형 리스트
        • 연속 리스트
        • 연결 리스트
      • 스택
      • 데크
    • 비선형 구조
      • 트리
      • 그래프

- 배열

  • 크기와 형이 동일한 자료들이 순서대로 나열된 자료이 집합
  • 반복적이 데이터 처리 작업에 적합
  • 정적인 자료 구조, 기억장소의 추가가 어려움
  • 데이터 삭제 시 기억장소가 빈 공간으로 남아있어 메모리 낭비 발생

- 연속 리스트

  • 연속되는 기억장소에 저장되는 자료 구조
  • 데이터를 삽입하기 위해서는 연속된 빈 공간이 있어야 함
  • 삽입, 삭제 시 자료의 이동 필요

- 연결 리스트

  • 자료들을 임의의 기억 공간에 기억시키되, 노드의 포인터 부분을 이용하여 서로 연결시킨 자료 구조
  • 연결을 위한 포인터 부분이 필요하기 때문이 기억 공간의 이용 효율이 좋지 않음
  • 접근 속도가 느리고, 연결이 끊어지면 다음 노드를 찾기 어려움

- 스택

  • 리스트의 한쪽 끝으로만 자료의 삽입, 삭제가 이루어지는 자료 구조
  • 후입선출(LIFO)
  • 저장할 기억 공간이 없는 상태에서 데이터가 삽입되면 Overflow 발생
  • 삭제할 데이터가 없는 상태에서 데이터를 삭제하면 Underflow 발생

- 큐

  • 리스트의 한쪽에서는 삽입, 다른 한쪽에서는 삭제 작업이 이루어지는 자료 구조
  • 선입선출(FIFO)
  • 시작을 표시하는 프런트 포인터와 끝을 표시하는 리어 포인터가 있음

- 그래프

  • 정점과 간선의 두 집합으로 이루어지는 자료 구조
  • 사이클이 없는 그래프를 트리라고 함
  • 간선의 방향성 유무에 따라 방향 그래프와 무방향 그래프로 구분

- 방향/무방향 그래프의 최대 간선 수

  • 방향 그래프의 최대 간선 수 : n(n-1)
  • 무방향 그래프의 최대 간선 수 : n(n-1)/2


23. 트리 – A

  • 정점과 선분을 이용하여 사이클을 이루지 않도록 구성한 그래프의 특수한 형태

- 트리 관련 용어

  • 노드 : 트리의 기본 요소
  • 근 노드 : 트리의 맨 위에 있는 노드
  • 디그리 : 각 노드에서 뻗어나온 가지의 수
  • 단말 노드 = 잎 노드 : 자식이 하나도 없는 노드
  • 비단말 노드 : 자식이 하나라도 있는 노드
  • 조상 노드 : 임의의 노드에서 근 노드에 이르는 경로상에 있는 노드들
  • 자식 노드 : 어떤 노드에 연결된 다음 레벨의 노드들
  • 부모 노드 : 어떤 노드에 연결된 이전 레벨의 노드들
  • 형제 노드 : 동일한 부모를 갖는 노드들
  • Level : 근 노드의 Level을 1로 가정한 후 어떤 Level이 L이면 자식 노드는 L+1
  • 깊이 : 트리에서 노드가 가질 수 있는 최대의 레벨
  • 숲 : 여러 개의 트리가 모여 있는 것
  • 트리의 디그리 : 노드들의 디그리 중에서 가장 많은 수


24. 이진 트리 – A

  • 차수가 2 이하인 노드들로 구성된 트리
  • 레벨 i에서 최대 노드의 수는 2^i-1
  • 단말 노드의 수가 n, 차수가 2인 노드 수가 m일 때 n = m + 1

- 트리의 운행법

  • 각 노드들을 찾아가는 방법
  • 산술식의 표기법과 연관성을 가짐
  • Preorder : Root - Left - Right
  • Inorder : Left - Root - Right
  • Postorder : Left - Right - Root

- 수식의 표기법

  • Infix 표기를 Postfix나 Prefix로 바꾸기
    • 연산 우선순위에 따라 괄호로 묶음
    • 연산자를 해당 괄호의 앞or뒤로 옮김
    • 필요없느 괄호 제거
  • Postfix나 Prefix로 표기된 수식을 Infix로 바꾸기
    • 인접한 피연산자 두 개와 오른쪽or왼쪽의 연산자를 괄호로 묶음
    • 연산자를 해당 피연산자의 가운데로 이동
    • 필요 없는 괄호 제거


25. 정렬 – A

- 삽입 정렬

  • 이미 순서화된 파일에 새로운 하나의 레코드를 순서에 맞게 삽입시켜 정렬하는 방식
  • 평균과 최악 모두 수행 시간 복잡도는 O(n^2)

- 선택 정렬

  • 최소값을 찾아 첫 번째 레코드 위치에 놓고, 나머지 n-1개 중에서 다시 최소값을 찾아 두 번째 레코드 위치에 놓는 방식을 반복하여 정렬
  • 평균과 최악 모두 수행 시간 복잡도는 O(n^2)

- 버블 정렬

  • 인접한 두 개의 레코드 키 값을 비교하여 그 크기에 따라 레코드 위치를 서로 교환하는 방식
  • 평균과 최악 모두 수행 시간 복잡도는 O(n^2)

- 쉘 정렬

  • 매개변수의 값으로 서브파일을 구성하고, 각 서브파일을 삽입 정렬 방식으로 순서 배열하는 과정을 반복
  • 삽입 정렬을 확장한 개념
  • 평균 수행 시간 복잡도는 O(n^1.5)
  • 최악 수행 시간 복잡도는 O(n^2)

- 퀵 정렬

  • 키를 기준으로 작은 값은 왼쪽, 큰 값은 오른쪽 서브 파일에 분해시키는 과정을 반복
  • 평균 수행 시간 복잡도는 O(nlogn)
  • 최악 수행 시간 복잡도는 O(n^2)

- 힙 정렬

  • 전이진 트리를 이용한 정렬 방식
  • 전이진 트리를 Heap Tree로 변환하여 정렬
  • 평균과 최악 모두 시간 복잡도는 O(nlogn)

- 2-Way 합병 정렬

  • 이미 정렬되어 있는 두 개의 파일을 한 개의 파일로 합병하는 정렬
  • 평균과 최악 모두 시간 복잡도는 O(nlogn)

- 기수 정렬

  • Queue를 이용하여 자릿수별로 정렬하는 방식
  • 평균과 최악 모두 시간 복잡도는 O(dn)

태그:

카테고리:

업데이트:

댓글남기기