[정보처리기사 실기] 2. 데이터 입출력 구현

23 분 소요

2021 시나공 정보처리기사 실기책 참고

주의! 중요도가 낮은 항목(C, D)은 일부 제외

1. 데이터베이스 개요 – A

데이터들을 논리적인 구조로 조직화하거나, 물리적인 공간에 구축한 것
논리 데이터저장소는 데이터 및 데이터 간의 연관성, 제약조건을 식별하여 논리적인 구조로 조직화한 것
물리 데이터저장소는 논리 데이터저장소를 SW가 운용될 환경의 물리적 특성을 고려하여 실제 저장장치에 저장한 것

- 데이터베이스

공동으로 사용될 데이터를 중복을 배제하여 통합하고, 저장장치에 저장하여 항상 사용할 수 있도록 운영하는 운영 데이터
통합된 데이터 : 자료의 중복을 배제한 데이터의 모임
저장된 데이터 : 컴퓨터가 접근할 수 있는 저장 매체에 저장된 자료
운영 데이터 : 조직의 고유한 업무를 수행하는 데 반드시 필요한 자료
공용 데이터 : 여러 응용 시스템들이 공동으로 소유하고 유지하는 자료

- DBMS(데이터베이스 관리 시스템)

사용자의 요구에 따라 정보를 생성해주고, DB를 관리해주는 SW
데이터의 종속성과 중복성의 문제를 해결하기 위해 제안된 시스템
필수 기능
- 정의 기능 : 데이터의 형과 구조에 대한 정의, 이용 방식, 제약 조건 등을 명시
- 조작 기능 : 데이터 검색, 삽입, 삭제 등을 위해 인터페이스 수단을 제공
- 제어 기능 : 데이터의 무결성, 보안, 권한 검사, 병행 제어를 제공

- 데이터의 독립성

종속성에 대비되는 말
논리적 독립성 : 응용 프로그램과 DB를 독립시킴으로써, 데이터의 논리적 구조를 변경시키더라도 응용 프로그램은 영향을 받지 않음
물리적 독립성 : 응용 프로그램과 보조기억장치 같은 물리적 장치를 독립시킴으로써, 디스크를 추가/변경하더라도 응용 프로그램은 영향을 받지 않음

- 스키마

DB의 구조와 제약조건에 관한 전반적인 명세를 기술한 것
외부 스키마
- 각 개인의 입장에서 필요로 하는 DB의 논리적 구조를 정의한 것
개념 스키마
- DB의 전체적인 논리적 구조
- 모든 응용 프로그램이나 사용자들이 필요로 하는 데이터를 종합한 조직 전체의 DB로 하나만 존재
내부 스키마
- 물리적 저장장치의 입장에서 본 DB 구조
- 실제로 저장될 레코드의 형식, 저장 데이터 항목의 표현 방법, 내부 레코드의 물리적 순서 등을 나타냄

2. 데이터베이스 설계 – A

사용자의 요구를 분석하여 그것들을 컴퓨터에 저장할 수 있는 DB 구조에 맞게 변형한 후, DBMS로 DB를 구현하여 일반 사용자들이 사용하게 하는 것

- 데이터베이스 설계 시 고려사항

무결성 : 연산 후에도 DB에 저장된 데이터가 정해진 제약 조건을 항상 만족
일관성 : 특정 질의에 대한 응답이 처음부터 끝까지 일정해야 함
회복 : 장애가 발생했을 때 장애 발생 직전의 상태로 복구할 수 있어야 함
보안 : 불법적인 데이터의 노출 또는 변경이나 손실로부터 보호할 수 있어야 함
효율성 : 응답시간의 단축, 시스템의 생산성, 저장 공간의 최적화 등 가능해야 함
데이터베이스 확장 : 운영에 영향을 주지 않으면서 지속적으로 데이터를 추가할 수 있어야 함

- 데이터베이스 설계 순서

요구 조건 분석 -> 개념적 설계 -> 논리적 설계 -> 물리적 설계 -> 구현

- 요구 조건 분석

DB를 사용할 사람들로부터 필요한 용도를 파악하는 것
요구 조건 명세서 작성

- 개념적 설계(정보 모델링, 개념화)

현실 세계에 대한 인식을 추상적 개념으로 표현하는 과정
개념 스키마 모델링과 트랜잭션 모델링을 병행 수행
요구 조건 명세를 DBMS에 독립적인 E-R 다이어그램으로 작성
DBMS에 독립적인 개념 스키마를 설계

- 논리적 설계(데이터 모델링)

현실 세계에서 발생하는 자료를 특정 DBMS가 지원하는 논리적 자료 구조로 변환시키는 과정
논리적 구조의 데이터로 모델화
개념 스키마를 평가 및 정제하고 DBMS에 따라 서로 다른 논리적 스키마를 설계
트랜잭션의 인터페이스를 설계

- 물리적 설계(데이터 구조화)

논리적 구조로 표현된 데이터를 물리적 구조의 데이터로 변환하는 과정
DB 파일의 저장 구조 및 액세스 경로를 결정
데이터가 컴퓨터에 저장되는 방법을 묘사

- 데이터베이스 구현

논리적 설계와 물리적 설계에서 도출된 DB 스키마를 파일로 생성하는 과정
응용 프로그램을 위한 트랜잭션을 작성
DB 접근을 위한 응용 프로그램을 작성

3. 데이터 모델의 개념 – B

현실 세계의 정보들을 단순화, 추상화하여 체계적으로 표현한 개념적 모형
개념적 도구들로 구성
데이터의 구조를 논리적으로 표현하기 위해 지능적 도구로 사용됨
구성 요소 : 개체, 속성, 관계
종류 : 개념적 데이터 모델, 논리적 데이터 모델, 물리적 데이터 모델
표시할 요소 : 구조, 연산, 제약 조건

- 개념적 데이터 모델

현실 세계에 대한 인간의 이해를 돕기 위해 현실 세계에 대한 인식을 추상적 개념으로 표현
정보 모델이라고도 함
E-R 모델

- 논리적 데이터 모델

개념적 구조를 컴퓨터 세계의 환경에 맞도록 변환하는 과정
특정 DBMS는 특정 논리적 데이터 모델 하나만 선정하여 사용
관계 모델, 계층 모델, 네트워크 모델로 구분

- 데이터 모델에 표시할 요소

구조 : 개체 타입들 간의 관계로서 데이터 구조 및 정적 성질 표현
연산 : 실제 데이터를 처리하는 작업에 대한 명세로서 DB를 조작하는 기본 도구
제약 조건 : DB에 저장될 수 있는 실제 데이터의 논리적인 제약 조건

4. 데이터 모델의 구성 요소 – B

- 개체

DB에 표현하려는 것으로, 개념이나 정보 단위 같은 현실 세계의 대상체
독립적으로 존재하거나 그 자체로서도 구별이 가능, 유일한 식별자에 의해 식별됨
다른 개체와 하나 이상의 관계가 있음
구성 요소
- 속성 : 개체가 가지고 있는 특성
- 개체 타입 : 속성으로만 기술된 개체의 정의
- 개체 인스턴스 : 개체를 구성하고 있는 각 속성들이 값을 가져 하나의 개체를 나타내는 것
- 개체 세트 : 개체 인스턴스의 집합

- 속성

DB를 구성하는 가장 작은 논리적 단위
파일 구조상의 데이터 항목 또는 데이터 필드에 해당
개체를 구성하는 항목으로 개체의 특성을 기술
속성의 수를 디그리 또는 차수라고 함
속성은 속성의 특성과 개체 구성 방식에 따라 분류

- 속성의 특성에 따른 분류

기본 속성
- 업무 분석을 통해 정의한 속성
- 가장 많고 일반적
- 업무상 코드로 정의한 속성은 기본 속성에서 제외됨
설계 속성
- 설계 과정에서 도출해내는 속성
- 업무를 규칙화하려고 속성을 새로 만들거나 변형하여 정의하는 속성
파생 속성
- 다른 속성으로부터 계산이나 변형 등의 영향을 받아 발생하는 속성
- 되도록 적은 수를 정의하는 것이 좋음

- 속성의 개체 구성 방식에 따른 분류

기본키 속성 : 개체를 유일하게 식별할 수 있는 속성
외래키 속성 : 다른 개체와의 관계에서 포함된 속성
일반 속성 : 개체에 포함되어 있고 기본키, 외래키에 포함되지 않은 속성

- 관계

개체와 개체 사이의 논리적인 연결
개체 간의 관계와 속성 간의 관계가 있음

- 관계의 형태

일 대 일(1:1) : A의 각 원소가 B의 원소 한 개와 대응하는 관계
일 대 다(1:N) : A의 각 원소는 B의 원소 여러 개와 대응, B의 각 원소는 A의 원소 한 개와 대응하는 관계
다 대 다(N:M) : A의 각 원소는 B의 원소 여러 개와 대응, B의 각 원소도 A의 원소 여러 개와 대응하는 관계

- 관계의 종류

종속 관계
- 두 개체 사이의 주종 관계를 표현한 것
- 식별 관계와 비식별 관계가 있음
중복 관계
- 두 개체 사이에 2번 이상의 종속 관계가 발생하는 관계
재귀 관계
- 개체가 자기 자신과 관계를 갖는 것
- 순한 관계라고도 함
배타 관계
- 개체의 속성이나 구분자를 기준으로 개체의 특성을 분할하는 관계
- 배타 AND 관계나 배타 OR 관계로 구분

5. E-R 모델 – A

현실 세계의 무질서한 데이터를 개념적인 논리 데이터로 표현하기 위한 방법
개념적 데이터 모델의 가장 대표적인 것
개체 타입과 관계 타입을 이용해 현실 세계를 개념적으로 표현
데이터를 개체, 관계, 속성으로 묘사
1:1, 1:N, N:M 등의 관계 유형을 제한 없이 나타낼 수 있음

- E-R 다이어그램

사각형 : 개체 타입
마름모 : 관계 타입
타원 : 속성
이중 타원 : 다중값 속성(복합 속성)
밑줄 타원 : 기본키 속성
복수 타원 : 복합 속성
관계 : 1:1, 1:N, N:M 등의 개체 간 관계에 대한 대응수를 선 위에 기술
선, 링크 : 개체 타입과 속성을 연결

6. 관계형 데이터베이스의 구조 / 관계형 데이터 모델 – A

2차원적인 표를 이용해서 데이터 상호 관계를 정의하는 DB
개체와 관계를 모두 릴레이션이라는 표로 표현
개체 릴레이션과 관계 릴레이션이 존재
장점 : 간결하고 보기 편리하며, 다른 DB로의 변환이 용이
단점 : 성능이 다소 떨어짐

- 관계형 데이터베이스의 릴레이션 구조

릴레이션은 데이터들을 표의 형태로 표현한 것
구조를 나타내는 릴레이션 스키마와 실제 값들인 릴레이션 인스턴스로 구성

- 튜플

릴레이션을 구성하는 각각의 행
속성의 모임으로 구성
파일 구조에서 레코드와 같은 의미
튜플의 수를 카디널리티 또는 기수, 대응수라고 함

- 속성

DB를 구성하는 가장 작은 논리적 단위
파일 구조상의 데이터 항목 또는 데이터 필드에 해당
개체의 특성을 기술
속성의 수를 디그리 또는 차수라고 함

- 도메인

하나의 애트리뷰트가 취할 수 있는 같은 타입의 원자값들의 집합

- 릴레이션의 특징

릴레이션에 포함된 튜플들은 모두 상이함
튜플 사이에는 순서가 없음
릴레이션은 시간에 따라 변함
속성들 간의 순서는 중요하지 않음
속성의 명칭은 유일해야 하지만, 값은 동일한 값이 있을 수 있음
튜플을 유일하게 식별하기 위해 속성들의 부분집합을 키로 설정
속성의 값은 논리적으로 더 이상 쪼갤 수 없는 원자값만을 저장

- 관계형 데이터 모델

2차원적인 표를 이용해서 데이터 상호 관계를 정의하는 DB 구조
가장 널리 사용되는 데이터 모델
속성들 간의 관계를 설정하거나 테이블 간의 관계를 설정하여 이용
기본키와 이를 참조하는 외래키로 데이터 간의 관계를 표현
계층 모델과 망 모델의 복잡한 구조를 단순화시킨 모델
대표적인 언어는 SQL
1:1, 1:N, N:M 관계를 자유롭게 표현할 수 있음

7. 관계형 데이터베이스의 제약 조건 - 키 – A

- 키

조건을 만족하는 튜플을 찾거나 순서대로 정렬할 때 기준이 되는 속성
후보키, 기본키, 대체키, 슈퍼키, 외래키

- 후보키

속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합
기본키로 사용할 수 있는 속성들
유일성과 최소성을 모두 만족시켜야 함
유일성 : 하나의 키 값으로 하나의 튜플만을 유일하게 식별할 수 있어야 함
최소성 : 속성 하나를 제거하면 유일하게 식별할 수 없도록 꼭 필요한 최소의 속성으로 구성

- 기본키

후보키 중에서 특별히 선정된 주키
중복된 값을 가질 수 없음
한 릴레이션에서 특정 튜플을 유일하게 구별할 수 있는 속성
NULL 값을 가질 수 없음

- 대체키

후보키가 둘 이상일 때 기본키를 제외한 나머지 후보키
보조키라고도 함

- 슈퍼키

속성들의 집합으로 구성된 키
슈퍼키로 구성된 속성의 집합과 동일한 값은 나타나지 않음
유일성은 만족하지만, 최소성은 만족하지 못함

- 외래키

다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합
참조 릴레이션의 기본키에 없는 값은 입력할 수 없음

8. 관계형 데이터베이스의 제약 조건 - 무결성 – A

- 무결성

DB에 저장된 데이터 값과 현실 세계의 실제값이 일치하는 정확성
부정확한 자료가 DB 내에 저장되는 것을 방지하기 위한 제약 조건

- 무결성의 종류

개체 무결성 : 기본키를 구성하는 어떤 속성도 NULL 값이나 중복값을 가질 수 없음
참조 무결성 : 외래키 값은 NULL이거나 참조 릴레이션의 기본키 값과 동일해야 함. 즉 참조할 수 없는 외래키 값을 가질 수 없음
도메인 무결성 : 주어진 속성 값이 정의된 도메인에 속한 값이어야 함
사용자 정의 무결성 : 사용자가 정의한 제약조건에 만족되어야 함
NULL 무결성 : 특정 속성 값이 NULL이 될 수 없도록 하는 규정
고유 무결성 : 특정 속성에 대해 각 튜플이 갖는 속성값들이 서로 달라야 함
키 무결성 : 하나의 릴레이션에는 적어도 하나의 키가 존재해야 함
관계 무결성 : 한 튜플의 삽입 가능 여부 또는 한 릴레이션과 다른 릴레이션의 튜플들 사이의 관계에 대한 적절성 여부를 지정한 규정

- 데이터 무결성 강화

데이터 품질에 직접적인 영향을 미치므로 데이터 특성에 맞는 적절한 무결성을 정의하고 강화해야 함
애플리케이션, 데이터베이스 트리거, 제약 조건을 이용하여 강화할 수 있음
애플리케이션 : 생성, 수정, 삭제 시 무결성 조건을 검증하는 코드를 프로그램 내에 추가
데이터베이스 트리거 : 트리거 이벤트에 무결성 조건을 실행하는 절차형 SQL을 추가
제약 조건 : DB에 제약 조건을 설정하여 무결성을 유지

9. 관계대수 및 관계해석 – A

- 관계대수

원하는 정보와 그 정보를 검색하기 위해서 어떻게 유도하는가를 기술하는 절차적인 언어
연산자와 연산규칙을 제공하며, 피연산자와 연산 결과가 모두 릴레이션
수행해야 할 연산의 순서를 명시
순수 관계 연산자와 일반 집합 연산자가 있음

- 순수 관계 연산자

Select
- 선택 조건을 만족하는 튜플의 부분집합을 구하여 새로운 릴레이션을 만드는 연산
- 수평연산
- 시그마(σ)
Project
- 속성 리스트에 제시된 속성 값만을 추출하여 새로운 릴레이션을 만드는 연산
- 수직연산
- 중복이 발생하면 중복이 제거됨
- 파이(π)
Join
- 공통 속성을 중심으로 두 개의 릴레이션을 하나로 합쳐서 새로운 릴레이션을 만드는 연산
- Join의 결과는 Cartesian Product(교차곱)을 수행한 다음 Select를 수행한 것과 같음
- ▷◁
Division
- X ⊃ Y인 두 개의 릴레이션 R(X), S(Y)가 있을 때, S가 가진 속성을 제외한 속성만을 구하는 연산
- ÷

- 일반 집합 연산자

수학적 집합 이론에서 사용하는 연산자
합집합, 교집합, 차집합을 처리하기 위해서는 합병 조건을 만족해야 함
UNION ∪ : 합집합
INTERSECTION ∩ : 교집합
DIFFERENCE - : 차집합
CARTESIAN PRODUCT X : 교차곱

- 관계해석

관계 데이터의 연산을 표현하는 방법
수학의 Predicate Calculus(술어 해석)에 기반
비절차적 특성
계산 수식을 사용

10. 이상 / 함수적 종속 – B

- 이상

테이블에서 데이터의 중복이 발생하고, 이 중복으로 인해 문제가 발생하는 현상
삽입 이상 : 데이터를 삽입할 때 의도와는 상관없이 원하지 않은 값들로 인해 삽입할 수 없게 되는 현상
삭제 이상 : 튜플을 삭제할 때 의도와는 상관없는 값들도 함께 삭제되는 현상
갱신 이상 : 튜플에 있는 속성 값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 불일치성이 생기는 현상

- 함수적 종속

속성 X의 값 각각에 대해 항상 속성 Y의 값이 오직 하나만 연관되어 있을 때 Y는 X에 함수적 종속이라고 함
X -> Y로 표기
DB에서 항상 유지되어야 할 조건
완전 함수적 종속
부분 함수적 종속

11. 정규화 – A

테이블의 속성들이 상호 종속적인 관계를 갖는 특성을 이용하여 테이블을 무손실 분해하는 과정
중복을 제거하여 삽입, 삭제, 갱신 이상의 발생 가능성을 줄이는 것

- 정규화 과정

제 1정규형
- 도메인이 원자 값만으로 되어 있는 정규형
- 도메인이 원자값
제 2정규형
- 기본키가 아닌 모든 속성이 기본키에 대하여 완전 함수적 종속을 만족하는 정규형
- 부분적 함수 종속 제거
제 3정규형
- 이행적 함수적 종속을 만족하지 않는 정규형
- 이행적 함수 종속 제거
BCNF
- 모든 결정자가 후보키인 정규형
- 결정자이면서 후보키가 아닌 것 제거
제 4정규형
- 다중 값 종속
- 다치 종속 제거
제 5정규형
- 조인 종속
- 조인 종속성 이용

12. 반정규화 – A

정규화된 데이터 모델을 의도적으로 통합, 중복, 분리하여 정규화 원칙을 위배하는 행위
시스템의 성능이 향상되고 관리 효율성 증가
데이터의 일관성 및 정합성이 저하될 수 있음
과도한 반정규화는 오히려 성능을 저하시킬 수 있음
방법
- 테이블 통합
- 테이블 분할
- 중복 테이블 추가
- 중복 속성 추가

- 테이블 통합

두 개의 테이블이 조인되어 사용되는 경우가 많을 경우 성능 향상을 위해 아예 하나의 테이블로 만들어 사용
테이블 통합을 고려하는 경우
- 두 개의 테이블에서 발생하는 프로세스가 동일하게 자주 처리되는 경우
- 항상 두 개의 테이블을 이용하여 조회를 수행하는 경우
테이블 통합의 종류
- 1:1 관계 테이블 통합
- 1:N 관계 테이블 통합
- 슈퍼타입/서브타입 테이블 통합

- 테이블 분할

테이블을 수직 또는 수평으로 분할하는 것
수평 분할
- 레코드를 기준으로 테이블을 분할하는 것
- 레코드별로 사용 빈도의 차이가 큰 경우 사용 빈도에 따라 테이블을 분할
수직 분할
- 하나의 테이블에 속성이 너무 많을 경우 속성을 기준으로 테이블을 분할
- 갱신 위주의 속성 분할, 자주 조회되는 속성 분할, 크기가 큰 속성 분할, 보안을 적용해야 하는 속성 분할

- 중복 테이블 추가

작업의 효율성을 향상키기기 위해 테이블을 추가하는 것
중복 테이블을 추가하는 경우
- 여러 테이블에서 데이터를 추출해서 사용해야 할 경우
- 다른 서버에 저장된 테이블을 이용해야 하는 경우
방법
- 집계 테이블의 추가
- 진행 테이블의 추가
- 특정 부분만을 포함하는 테이블의 추가

- 중복 속성 추가

조인해서 데이터를 처리할 때 데이터를 조회하는 경로를 단축하기 위해 자주 사용하는 속성을 하나 더 추가하는 것
데이터의 무결성 확보가 어렵고, 디스크 공간이 추가로 필요
중복 속성을 추가하는 경우
- 조인이 자주 발생하는 속성인 경우
- 접근 경로가 복잡한 속성인 경우
- 액세스의 조건으로 자주 사용되는 속성인 경우
- 기본키의 형태가 적절하지 않거나 여러 개의 속성으로 구성된 경우

13. 시스템 카탈로그 – B

다양한 객체에 관한 정보를 포함하는 시스템 DB
사용자를 포함하여 DBMS에서 지원하는 모든 데이터 객체에 대한 정의나 명세에 관한 정보를 유지 관리하는 시스템 테이블
카탈로그들이 생성되면 데이터 사전에 저장

- 메타 데이터

시스템 카탈로그에 저장된 정보

- 데이터 디렉터리

데이터 사전에 수록된 데이터에 접근하는 데 필요한 정보를 유지 관리하는 시스템
시스템 카탈로그는 사용자와 시스템 모두 접근할 수 있지만, 데이터 디렉터리는 시스템만 접근할 수 있음

14. 트랜잭션 분석 / CRUD 분석 – A

- 트랜잭션

논리적 기능을 수행하기 위한 작업의 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산
병행 제어 및 회복 작업 시 처리되는 작업의 논리적 단위로 사용
시스템이 응답하기 위한 상태 변환 과정의 작업 단위로 사용

- 트랜잭션의 특성

Atomicity(원자성) : 트랜잭션의 연산은 DB에 모두 반영되도록 Commit되던지 전혀 반영되지 않도록 Rollback 되어야 함
Consistency(일관성) : 트랜잭션이 실행을 성공적으로 완료하면 언제나 일관성 있는 DB 상태로 변환
Isolation(독립성, 격리성, 순차성) : 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행중에 다른 트랜잭션의 연산이 끼어들 수 없음
Durability(영속성, 지속성) : 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장나더라도 영구적으로 반영

- CRUD 분석

프로세스와 테이블 간에 CRUD 매트릭스를 만들어서 트랜잭션을 분석하는 것
많은 트랜잭션이 몰리는 테이블을 파악할 수 있어 디스크 구성 시 유용한 자료로 활용할 수 있음
CRUD 매트릭스
- 행에는 프로세스, 열에는 테이블, 행과 열이 만나는 위치에는 프로세스가 테이블에 발생시키는 변화를 표시
- 트랜잭션이 테이블에 수행하는 작업을 검증
- C > D > U > R의 우선순위 적용

- 트랜잭션 분석

테이블에 저장되는 데이터의 양을 유추하고 이를 근거로 DB의 용량 산정 및 구조의 최적화를 목적으로 함
업무 개발 담당자가 수행
과도하게 접근하는 테이블을 확인할 수 있음
집중 접근 테이블을 여러 디스크에 분산 배치함으로써 디스크 입출력 향상을 통한 성능 향상을 가져올 수 있음
트랜잭션 분석서 : 단위 프로세스와 CRUD 매트릭스를 이용하여 작성

15. 인덱스 – B

데이터 레코드를 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터 구조
물리적 구조에 접근하는 방법 제공
파일의 레코드에 빠르게 액세스 할 수 있음
삽입과 삭제가 수시로 일어나는 경우에는 인덱스의 개수를 최소로 하는 것이 효율적

- 인덱스의 종류

트리 기반 인덱스 : 인덱스를 저장하는 블록들이 트리 구조를 이루고 있는 것
비트맵 인덱스 : 인덱스 컬럼의 데이터를 Bit 값인 0 또는 1로 변환하여 인덱스 키로 사용하는 방법
함수 기반 인덱스 : 컬럼에 특정 함수나 수식을 적용하여 산출된 값을 사용하는 것
비트맵 조인 인덱스 : 다수의 조인된 객체로 구성되 인덱스
도메인 인덱스 : 개발자가 필요한 인덱스를 직접 만들어 사용하는 것

- 클러스터드/넌클러스터드 인덱스

클러스터드 인덱스
- 인덱스 키의 순서에 따라 데이터가 정렬되어 저장되는 방식
- 데이터가 순서대로 저장되어 있어 인덱스를 검색하지 않아도 원하는 데이터를 빠르게 찾을 수 있음
넌클러스터드 인덱스
- 인덱스의 키 값만 정렬되어 있고 실제 데이터는 정렬되지 않는 방식
- 데이터 삽입, 삭제 발생 시 순서를 유지하기 위해 데이터를 재정렬해야 함

16. 뷰 / 클러스터 – A

- 뷰

접근이 허용된 자료만을 제한적으로 보여주기 위해 하나 이상의 기본 테이블로부터 유도된 가상 테이블
저장장치 내에 물리적으로 존재하지 않지만, 있는 것처럼 간주
뷰에 나타나지 않는 데이터를 안전하게 보호
뷰가 정의된 기본 테이블이나 뷰를 삭제하면 그 테이블이나 뷰를 기초로 정의된 다른 뷰도 자동으로 삭제
정의시 CREATE, 삭제시 DROP문 사용

- 뷰의 장단점

장점
- 논리적 데이터 독립성 제공
- 동시에 여러 사용자의 상이한 응용이나 요구를 지원
- 데이터 관리를 간단하게 해줌
- 접근 제어를 통한 자동 보안 제공
단점
- 독립적인 인덱스를 가질 수 없음
- 뷰의 정의를 변경할 수 없음
- 뷰로 구성되 내용에 대한 삽입, 삭제, 갱신 연산에 제약이 따름

- 클러스터

동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법
데이터 조회 속도를 향상시키지만 입력, 수정, 삭제에 대한 작업 성능을 저하
데이터의 분포도가 넓을수록 유리
저장 공간을 절약할 수 있음
처리 범위가 넓은 경우에는 단일 테이블 클러스터링 사용
조인이 많이 발생하는 경우에는 다중 테이블 클러스터링 사용

17. 파티션 – B

대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것
성능 저하 방지, 데이터 관리가 쉬워짐
데이터 처리는 테이블 단위로, 데이터 저장은 파티션별로 수행

- 파티션의 장단점

장점
- 데이터 접근 시 액세스 범위를 줄여 쿼리 성능 향상
- 디스크 성능 향상
- 파티션별로 백업 및 복구를 수행하므로 속도가 빠름
- 시스템 장애 시 데이터 손상 정도를 최소화할 수 있음
- 데이터 가용성 향상
- 파티션 단위로 입출력을 분산시킬 수 있음
단점
- 세심한 관리가 요구됨
- 테이블간 조인에 대한 비용 증가
- 용량이 작은 테이블에 파티셔닝을 수행하면 오히려 성능이 저하됨

- 파티션의 종류

범위 분할
- 지정한 열의 값을 기준으로 분할
해시 분할
- 해시 함수를 적용한 결과 값에 따라 데이터를 분할
- 범위 분할의 단점을 보완한 것으로, 데이터를 고르게 분산할 때 유용
- 특정 데이터가 어디에 있는지 판단할 수 없음
- 데이터가 고른 컬럼에 효과적
조합 분할
- 범위 분할로 분할한 다음 해시 함수를 적용하여 다시 분할
- 범위 분할한 파티션이 너무 커서 관리가 어려울 때 유용

18. 분산 데이터베이스 설계 – A

- 데이터베이스 용량 설계

데이터가 저장될 공간을 정의하는 것
테이블에 저장될 데이터양과 인덱스, 클러스터 등이 차지하는 공간 등을 예측하여 반영
목적
- 용량을 정확히 산정하여 디스크으 저장 공간을 효과적으로 사용하고 확장성 및 가용성을 높임
- 디스크의 입출력 부하를 분산시키고 채널의 병목 현상을 최소화

- 분산 데이터베이스 설계

논리적으로는 하나의 시스템에 속하지만 물리적으로는 네트워크를 통해 연결된 여러 개의 사이트에 분산된 데이터베이스
데이터의 처리나 이용이 많은 지역에 DB를 위치시켜 데이터의 처리가 가능한 해당 지역에서 해결될 수 있도록 함
애플리케이션이나 사용자가 분산되어 저장된 데이터에 접근하게 하는 것을 목적으로 함

- 분산 데이터베이스의 목표

위치 투명성 : 액세스하려는 DB의 실제 위치를 알 필요 없이 단지 DB의 논리적인 명칭만으로 액세스할 수 있음
중복 투명성 : 동일 데이터가 여러 곳에 중복되어 있더라도 사용자는 마치 하나의 데이터만 존재하는 것처럼 사용하고, 시스템은 자동으로 여러 자료에 대한 작업 수행
병행 투명성 : 다수의 트랜잭션들이 동시에 실현되더라도 그 트랜잭션의 결과는 영향을 받지 않음
장애 투명성 : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션을 정확하게 처리

- 분산 설계 방법

테이블 위치 분산
- 테이블을 각기 다른 서버에 분산시켜 배치
분할
- 데이터를 분할하여 분산
- 규칙 : 완전성, 재구성, 상호 중첩 배제
- 방법
  - 수평 분할
  - 수직 분할
할당
- 동일한 분할을 여러 개의 서버에 생성하는 분산 방법
- 중복이 없는 할당과 중복이 있는 할당으로 나뉨

19. 데이터베이스 이중화 / 서버 클러스터링 – B

- 데이터베이스 이중화

동일한 데이터베이스를 복제하여 관리하는 것
DB에 문제가 발생하면 복제된 DB를 이용하여 즉시 문제를 해결
사용자가 수행하는 작업은 DB 이중화 시스템에 연결된 다른 DB에도 동일하게 적용
분산 처리하므로, DB의 부하를 줄일 수 있음
손쉽게 백업 서버를 운영할 수 있음

- 데이터베이스 이중화의 분류

Eager 기법
- 트랜잭션 수행 중 데이터 변경이 발생하면 이중화된 모든 DB에 즉시 전달하여 변경 내용이 즉시 적용
Lazy 기법
- 트랜잭션의 수행이 종료되면 변경 사실을 새로운 트랜잭션에 작성하여 각 DB에 전달되는 기법
- DB마다 새로운 트랜잭션이 수행되는 것으로 간주

- 데이터베이스 이중화 구성 방법

활동-대기 방법
- 활성 DB에 장애가 발생하면 대기 상태에 있던 DB가 자동으로 모든 서비스를 대신 수행
- 구성 방법과 관리가 쉬워 많은 기업에서 이용
활동-활동 방법
- 서로 다른 서비스를 제공하다가 둘 중 한쪽 DB에 문제가 발생하면 나머지 다른 DB가 서비스 제공
- 처리율이 높지만 구성 방법 및 설정이 복잡

- 클러스터링

두 대 이상의 서버를 하나의 서버처럼 운영하는 기술
서버 이중화 및 공유 스토리지를 사용하여 서버의 고가용성을 제공
종류
- 고가용성 클러스터링
  - 하나의 서버에 장애가 발생하면 다른 노드가 받아 처리하여 서비스 중단을 방지
- 병렬 처리 클러스터링
  - 전체 처리율을 높이기 위해 하나의 작업을 여러 개의 서버에서 분산하여 처리

- RTO/RPO

RTO(목표 복구 시간) : 업무 중단 시점으로부터 복구되어 가동될 때까지의 소요 시간
RPO(목표 복구 시점) : 데이터를 복구할 수 있는 기준점

20. 데이터베이스 보안 – B

DB의 일부 또는 전체에 대해서 권한이 없는 사용자가 액세스하는 것을 금지하기 위해 사용되는 기술

- 암호화

데이터를 보낼 때 송신자가 지정한 수신자 이외에는 그 내용을 알 수 없도록 평문을 암호문으로 변환하는 것
암호화 과정 : 평문을 암호문으로 바꿈
복호화 과정 : 암호문을 평문으로 바꿈
암호화 기법 : 개인키, 공개키 방식

- 접근 통제

데이터가 저장된 객체와 이를 사용하려는 주체 사이의 정보 흐름을 제한
접근통제 3요소
- 접근통제 정책
- 접근통제 메커니즘
- 접근통제 보안모델
접근통제 기술
- 임의 접근통제(DAC)
  - 데이터에 접근하는 사용자의 신원에 따라 접근 권한을 부여
  - 데이터 소유자가 접근통제 권한을 지정하고 제어
  - 객체를 생성한 사용자가 객체에 대한 모든 권한을 부여받고, 권한을 다른 사용자에게 허가할 수 있음
- 강제 접근통제(MAC)
  - 주체와 객체의 등급을 비교하여 접근 권한을 부여
  - 시스템이 접근통제 권한을 지정
  - DB 객체별로 보안 등급을 부여할 수 있음
  - 사용자별로 인가 등급을 부여할 수 있음
- 역할기반 접근통제(RBAC)
  - 사용자의 역할에 따라 접근 권한을 부여
  - 중앙관리자가 접근통제 권한을 지정
  - 임의 접근통제와 강제 접근통제의 단점을 보완
  - 다중 프로그래밍 환경에 최적화

- 접근통제 정책

어떤 주체가 언제, 어디서, 어떤 객체에게, 어떤 행위에 대한 허용 여부를 정의하는 것
종류
- 신분 기반 정책
  - 주체나 그룹의 신분에 근거하여 객체의 접근을 제한
  - IBP : 최소 권한 정책, 단일 주체에게 하나의 객체에 대한 허가 부여
  - GBP : 복수 주체에 하나의 객체에 대한 허가 부여
- 규칙 기반 정책
  - 주체가 갖는 권한에 근거하여 객체의 접근을 제한하는 방법
  - MLP : 사용자나 객체별로 지정된 기밀 분류에 따른 정책
  - CBP : 집단별로 지정된 기밀 허가에 따른 정책
- 역할 기반 정책
  - GBP의 변형된 정책
  - 주체의 신분이 아니라 주체가 맡은 역할에 근거하여 객체의 접근을 제한

- 접근통제 매커니즘

정의된 접근통제 정책을 구현하는 기술적인 방법
접근통제 목록, 능력 리스트, 보안 등급, 패스워드, 암호화 등

- 접근통제 보안 모델

보안 정책을 구현하기 위한 정형화된 모델
기밀성 모델
- 군사적인 목적으로 개발된 최초의 수학적 모델
- 기밀성 보장이 최우선
- 군대 시스템 등 특수 환경에서 주로 사용
무결성 모델
- 불법적인 정보 변경을 방지하기 위해 무결성을 기반으로 개발된 모델
접근통제 모델
- 접근통제 메커니즘을 보안 모델로 발전시킨 것
- 접근통제 행렬이 있음

- 접근통제 조건

접근통제 매커니즘의 취약점을 보완하기 위해 접근통제 정책에 부가하여 적용할 수 있는 조건
값 종속 통제 : 객체에 저장된 값에 따라 다르게 접근통제를 허용해야 하는 경우에 사용
다중 사용자 통제 : 지정된 객체에 다수의 사용자가 동시에 접근을 요구하는 경우에 사용
컨텍스트 기반 통제 : 특정 시간, 네트워크 주소, 접근 경로, 인증 수준 등에 근거하여 접근을 제어하는 방법. 보안 시스템의 취약점을 보완할 때 사용

- 감사 추적

사용자나 애플리케이션이 DB에 접근하여 수행한 모든 활동을 기록하는 기능
오류가 발생한 DB를 복구하거나 부적절한 데이터 조작을 파악하기 위해 사용

21. 스토리지 – B

대용량의 데이터를 저장하기 위해 서버와 저장장치를 연결하는 기술
DAS, NAS, SAN

- DAS

서버와 저장장치를 전용 케이블로 직접 연결하는 방식
속도가 빠르고 설치 및 운영이 쉬움
초기 구축 비용 및 유지보수 비용 저렴
다른 서버에서 접근할 수 없고 파일을 공유할 수 없음
확장성 및 유연성이 떨어짐

- NAS

서버와 저장장치를 네트워크를 통해 연결하는 방식
NAS Storage가 내장된 저장장치를 직접 관리
Ethernet 스위치를 통해 다른 서버에서도 스토리지에 접근할 수 있어 파일 공유가 가능
장소에 구애받지 않고 저장장치에 쉽게 접근
DAS에 비해 확장성 및 유연성이 우수

- SAN

DAS의 빠른 처리와 NAS의 파일 공유 장점을 혼합한 방식
서버와 저장장치를 연결하는 전용 네트워크를 별도로 구성하는 방식
파이버 채널 스위치를 이용하여 네트워크 구성
처리 속도가 빠름
서버들이 저장장치 및 파일을 공유할 수 있음
확장성, 유연성, 가용성이 뛰어남

22. 자료 구조 – B

자료를 기억장치의 공간 내에 저장하는 방법과 자료 간의 관계, 처리 방법 등을 연구 분석하는 것
저장 공간의 효율성과 실행시간의 단축을 위해 사용
분류
- 선형 구조
  - 배열
  - 선형 리스트
    - 연속 리스트
    - 연결 리스트
  - 스택
  - 큐
  - 데크
- 비선형 구조
  - 트리
  - 그래프

- 배열

크기와 형이 동일한 자료들이 순서대로 나열된 자료이 집합
반복적이 데이터 처리 작업에 적합
정적인 자료 구조, 기억장소의 추가가 어려움
데이터 삭제 시 기억장소가 빈 공간으로 남아있어 메모리 낭비 발생

- 연속 리스트

연속되는 기억장소에 저장되는 자료 구조
데이터를 삽입하기 위해서는 연속된 빈 공간이 있어야 함
삽입, 삭제 시 자료의 이동 필요

- 연결 리스트

자료들을 임의의 기억 공간에 기억시키되, 노드의 포인터 부분을 이용하여 서로 연결시킨 자료 구조
연결을 위한 포인터 부분이 필요하기 때문이 기억 공간의 이용 효율이 좋지 않음
접근 속도가 느리고, 연결이 끊어지면 다음 노드를 찾기 어려움

- 스택

리스트의 한쪽 끝으로만 자료의 삽입, 삭제가 이루어지는 자료 구조
후입선출(LIFO)
저장할 기억 공간이 없는 상태에서 데이터가 삽입되면 Overflow 발생
삭제할 데이터가 없는 상태에서 데이터를 삭제하면 Underflow 발생

- 큐

리스트의 한쪽에서는 삽입, 다른 한쪽에서는 삭제 작업이 이루어지는 자료 구조
선입선출(FIFO)
시작을 표시하는 프런트 포인터와 끝을 표시하는 리어 포인터가 있음

- 그래프

정점과 간선의 두 집합으로 이루어지는 자료 구조
사이클이 없는 그래프를 트리라고 함
간선의 방향성 유무에 따라 방향 그래프와 무방향 그래프로 구분

- 방향/무방향 그래프의 최대 간선 수

방향 그래프의 최대 간선 수 : n(n-1)
무방향 그래프의 최대 간선 수 : n(n-1)/2

23. 트리 – A

정점과 선분을 이용하여 사이클을 이루지 않도록 구성한 그래프의 특수한 형태

- 트리 관련 용어

노드 : 트리의 기본 요소
근 노드 : 트리의 맨 위에 있는 노드
디그리 : 각 노드에서 뻗어나온 가지의 수
단말 노드 = 잎 노드 : 자식이 하나도 없는 노드
비단말 노드 : 자식이 하나라도 있는 노드
조상 노드 : 임의의 노드에서 근 노드에 이르는 경로상에 있는 노드들
자식 노드 : 어떤 노드에 연결된 다음 레벨의 노드들
부모 노드 : 어떤 노드에 연결된 이전 레벨의 노드들
형제 노드 : 동일한 부모를 갖는 노드들
Level : 근 노드의 Level을 1로 가정한 후 어떤 Level이 L이면 자식 노드는 L+1
깊이 : 트리에서 노드가 가질 수 있는 최대의 레벨
숲 : 여러 개의 트리가 모여 있는 것
트리의 디그리 : 노드들의 디그리 중에서 가장 많은 수

24. 이진 트리 – A

차수가 2 이하인 노드들로 구성된 트리
레벨 i에서 최대 노드의 수는 2^i-1
단말 노드의 수가 n, 차수가 2인 노드 수가 m일 때 n = m + 1

- 트리의 운행법

각 노드들을 찾아가는 방법
산술식의 표기법과 연관성을 가짐
Preorder : Root - Left - Right
Inorder : Left - Root - Right
Postorder : Left - Right - Root

- 수식의 표기법

Infix 표기를 Postfix나 Prefix로 바꾸기
- 연산 우선순위에 따라 괄호로 묶음
- 연산자를 해당 괄호의 앞or뒤로 옮김
- 필요없느 괄호 제거
Postfix나 Prefix로 표기된 수식을 Infix로 바꾸기
- 인접한 피연산자 두 개와 오른쪽or왼쪽의 연산자를 괄호로 묶음
- 연산자를 해당 피연산자의 가운데로 이동
- 필요 없는 괄호 제거

25. 정렬 – A

- 삽입 정렬

이미 순서화된 파일에 새로운 하나의 레코드를 순서에 맞게 삽입시켜 정렬하는 방식
평균과 최악 모두 수행 시간 복잡도는 O(n^2)

- 선택 정렬

최소값을 찾아 첫 번째 레코드 위치에 놓고, 나머지 n-1개 중에서 다시 최소값을 찾아 두 번째 레코드 위치에 놓는 방식을 반복하여 정렬
평균과 최악 모두 수행 시간 복잡도는 O(n^2)

- 버블 정렬

인접한 두 개의 레코드 키 값을 비교하여 그 크기에 따라 레코드 위치를 서로 교환하는 방식
평균과 최악 모두 수행 시간 복잡도는 O(n^2)

- 쉘 정렬

매개변수의 값으로 서브파일을 구성하고, 각 서브파일을 삽입 정렬 방식으로 순서 배열하는 과정을 반복
삽입 정렬을 확장한 개념
평균 수행 시간 복잡도는 O(n^1.5)
최악 수행 시간 복잡도는 O(n^2)

- 퀵 정렬

키를 기준으로 작은 값은 왼쪽, 큰 값은 오른쪽 서브 파일에 분해시키는 과정을 반복
평균 수행 시간 복잡도는 O(nlogn)
최악 수행 시간 복잡도는 O(n^2)

- 힙 정렬

전이진 트리를 이용한 정렬 방식
전이진 트리를 Heap Tree로 변환하여 정렬
평균과 최악 모두 시간 복잡도는 O(nlogn)

- 2-Way 합병 정렬

이미 정렬되어 있는 두 개의 파일을 한 개의 파일로 합병하는 정렬
평균과 최악 모두 시간 복잡도는 O(nlogn)

- 기수 정렬

Queue를 이용하여 자릿수별로 정렬하는 방식
평균과 최악 모두 시간 복잡도는 O(dn)

Twitter Facebook LinkedIn

LWW

1. 데이터베이스 개요 – A

- 데이터베이스

- DBMS(데이터베이스 관리 시스템)

- 데이터의 독립성

- 스키마

2. 데이터베이스 설계 – A

- 데이터베이스 설계 시 고려사항

- 데이터베이스 설계 순서

- 요구 조건 분석

- 개념적 설계(정보 모델링, 개념화)

- 논리적 설계(데이터 모델링)

- 물리적 설계(데이터 구조화)

- 데이터베이스 구현

3. 데이터 모델의 개념 – B

- 개념적 데이터 모델

- 논리적 데이터 모델

- 데이터 모델에 표시할 요소

4. 데이터 모델의 구성 요소 – B

- 개체

- 속성

- 속성의 특성에 따른 분류

- 속성의 개체 구성 방식에 따른 분류

- 관계

- 관계의 형태

- 관계의 종류

5. E-R 모델 – A

- E-R 다이어그램

6. 관계형 데이터베이스의 구조 / 관계형 데이터 모델 – A

- 관계형 데이터베이스의 릴레이션 구조

- 튜플

- 속성

- 도메인

- 릴레이션의 특징

- 관계형 데이터 모델

7. 관계형 데이터베이스의 제약 조건 - 키 – A

- 키

- 후보키

- 기본키

- 대체키

- 슈퍼키

- 외래키

8. 관계형 데이터베이스의 제약 조건 - 무결성 – A

- 무결성

- 무결성의 종류

- 데이터 무결성 강화

9. 관계대수 및 관계해석 – A

- 관계대수

- 순수 관계 연산자

- 일반 집합 연산자

- 관계해석

10. 이상 / 함수적 종속 – B

- 이상

- 함수적 종속

11. 정규화 – A

- 정규화 과정

12. 반정규화 – A

- 테이블 통합

- 테이블 분할

- 중복 테이블 추가

- 중복 속성 추가

13. 시스템 카탈로그 – B

- 메타 데이터

- 데이터 디렉터리

14. 트랜잭션 분석 / CRUD 분석 – A

- 트랜잭션

- 트랜잭션의 특성

- CRUD 분석

- 트랜잭션 분석

15. 인덱스 – B

- 인덱스의 종류

- 클러스터드/넌클러스터드 인덱스

16. 뷰 / 클러스터 – A

- 뷰

- 뷰의 장단점

- 클러스터

17. 파티션 – B

- 파티션의 장단점

- 파티션의 종류

18. 분산 데이터베이스 설계 – A