728x90
- 데이터 표준화
데이터 항목(틀)에 대한 명칭과 의미를 정하고 실제 저장하고 활용하는 데이터 값(내용)에 대한 형식 및 범위를 규정하는 활동
- 데이터 표준화는 데이터 모델링과 밀접한 관계를 가지고 잇으며, 독립적ㅇ니 영역이지만, 일반적으로 데이터 모델링을 진행하면서 표준화를 먼저 수행하는 경우가 대부분이고, 속성명을 부여할 때 표준을 준수해야한다.
- 표준화 종류
- 표준단어: 의미를 가지는최소 단위의 낱말, 복합어
- 표준도메인: 단어 or 용어의 일종으로 데이터 값의 형식과 범위를 포함
- 표준코드: 도메인의 일부로 볼 수 있으며, 목록화된 데이터 값만 사용할 수 있도록 한다.
- 표준용어: 현업에서 사용하는 기술 용어, 업무 용어 모두 포함, 단어와 단어의 조합으로 구성
- 연관성
- 표준단어, 표준도메인, 표준용어
1. 단어 표준화 (표준단어)
- 업무 또는 IT에서 사용하는 단어를 식별하고 정의하는 과정
- 데이터 모델의 엔티티, 속성 등의 명칭으로 활용
- 표준 단어 저자 블로그 : https://blog.naver.com/easttree
- 표준 단어 - 영문 약어
- 아래 표의 규칙을 따르는 것을 권장
2. 도메인 표준화(표준도메인)
- type, 자리수
- 예) 금액 관련된 도메인은 6자리 숫자로 통일, 날짜의 경우 Date, Datetime, char(8)를 사용, 문서번호의 경우 6자리 || 8자리 char
- 도메인 작성
- 문자형, 숫자형, 날짜형
- 도메인 집합의 성격
- 유사 도메인을 묶어 도메인 그룹으로 분류
- 도메인을 잘 표현하는 명칭 부여
- 도메인 작성 예시
- 문자형 도메인 : 이름, 제목, 내용, 비고, 주소, 설명, 경로
- 유사한 성격 : 명칭(이름, 제목), 내용(내용, 비고, 설명), 주소(주소, 경로)
- 도메인 명칭 : 표준단어와 동일하게 사용, 인포탙입에서 데이터형식과 길이를 관리하도록 기준 만들기
3. 코드 표준화 (완전 중요)
3.1. 실습
- 실습 전 이해란
- 상태가 자주 변하는 column의 경우 코드 표준화를 통해서 글자가 아닌 code를 통해서 상태를 나타내고 code가 중복되는 것에 의문이있지만 코드유형ID가 다르기 때문에 분류가 가능하다.
- 실습 후 경험 작성란
3.2. 개념
- 통계를 내거나 한정된 데이터 값을 목록화하여 관리하고자 하는 대상을 코드로 식별하여 정의
- 코드의 분류
- 공통코드
- 목록성 코드 : 한국표준산업분류코드, 코드 추가 변경이 자주 발생하고나 코드 구조가 복잡한 경우(계층구조)
- 코드 표준화 대상
- 공통코드와 목록성 코드를 모두 포함한다.
- 예시
- 거래 은행 (a 은행, b 은행) 이체은행 (c은행, d은행) -> 통합한다. 은행 (a 은행, b 은행, c은행, d은행)
- 개별적으로 사용해야하는 경우 : 001(a 은행), 002(b 은행), 003(c은행), 004(d은행)으로 코드유형id 부여
4. 용어 표준화 (표준용어)
- 175p 맞춰서 수행