DB/data modeling

9. 논리 모델링_데이터 표준화

wooweee 2023. 5. 28. 16:18
728x90
  • 데이터 표준화
    데이터 항목(틀)에 대한 명칭과 의미를 정하고 실제 저장하고 활용하는 데이터 값(내용)에 대한 형식 및 범위를 규정하는 활동

 

  • 데이터 표준화는 데이터 모델링과 밀접한 관계를 가지고 잇으며, 독립적ㅇ니 영역이지만, 일반적으로 데이터 모델링을 진행하면서 표준화를 먼저 수행하는 경우가 대부분이고, 속성명을 부여할 때 표준을 준수해야한다.

 

  • 표준화 종류
    1. 표준단어: 의미를 가지는최소 단위의 낱말, 복합어
    2. 표준도메인: 단어 or 용어의 일종으로 데이터 값의 형식과 범위를 포함
    3. 표준코드: 도메인의 일부로 볼 수 있으며, 목록화된 데이터 값만 사용할 수 있도록 한다.
    4. 표준용어: 현업에서 사용하는 기술 용어, 업무 용어 모두 포함, 단어와 단어의 조합으로 구성
  • 연관성
    • 표준단어, 표준도메인, 표준용어

 

1. 단어 표준화 (표준단어)

  • 업무 또는 IT에서 사용하는 단어를 식별하고 정의하는 과정
  • 데이터 모델의 엔티티, 속성 등의 명칭으로 활용
  • 표준 단어 저자 블로그 : https://blog.naver.com/easttree

 

  • 표준 단어 - 영문 약어
    • 아래 표의 규칙을 따르는 것을 권장

 

2. 도메인 표준화(표준도메인)

  • type, 자리수
    • 예) 금액 관련된 도메인은 6자리 숫자로 통일, 날짜의 경우 Date, Datetime, char(8)를 사용, 문서번호의 경우 6자리 || 8자리 char
  • 도메인 작성
    1. 문자형, 숫자형, 날짜형
    2. 도메인 집합의 성격
    3. 유사 도메인을 묶어 도메인 그룹으로 분류
    4. 도메인을 잘 표현하는 명칭 부여
  • 도메인 작성 예시
    1. 문자형 도메인 : 이름, 제목, 내용, 비고, 주소, 설명, 경로
    2. 유사한 성격 : 명칭(이름, 제목), 내용(내용, 비고, 설명), 주소(주소, 경로)
    3. 도메인 명칭 : 표준단어와 동일하게 사용, 인포탙입에서 데이터형식과 길이를 관리하도록 기준 만들기

 

3. 코드 표준화 (완전 중요)

3.1. 실습 

  • 실습 전 이해란
    • 상태가 자주 변하는 column의 경우 코드 표준화를 통해서 글자가 아닌 code를 통해서 상태를 나타내고 code가 중복되는 것에 의문이있지만 코드유형ID가 다르기 때문에 분류가 가능하다.
  • 실습 후 경험 작성란

 

3.2. 개념

아주 중요한 이미지

  • 통계를 내거나 한정된 데이터 값을 목록화하여 관리하고자 하는 대상을 코드로 식별하여 정의

  • 코드의 분류
    • 공통코드
    • 목록성 코드 : 한국표준산업분류코드, 코드 추가 변경이 자주 발생하고나 코드 구조가 복잡한 경우(계층구조)
  • 코드 표준화 대상
    • 공통코드와 목록성 코드를 모두 포함한다.
  • 예시
    • 거래 은행 (a 은행, b 은행) 이체은행 (c은행, d은행) -> 통합한다. 은행 (a 은행, b 은행, c은행, d은행)
    • 개별적으로 사용해야하는 경우 : 001(a 은행), 002(b 은행), 003(c은행), 004(d은행)으로 코드유형id 부여

 

코드 부여
분류형 사전순

 

4. 용어 표준화 (표준용어)

  • 175p 맞춰서 수행