열 복사, 데이터 변환, 파생 열, 문자표
멀티 캐스트 변환이 입력되는 데이터 전체에 대한 복사 작업이라면, 열 복사 변환은 입력되는 데이터의 열에 대해서 복사를 하는 변환입니다. 파생 열이나 데이터 변환, 문자표 변환 역시, 입력 데이터에 대해 열 수준의 변경 작업을 수행합니다.
입력되는 열에 대한 변경 작업으로써 비슷한 유형이지만 다음과 같은 차이점이 있습니다.
변환 명 |
작업 내용 |
열 복사 |
입력 데이터 중, 특정 열을 동일하게 복사 |
데이터 변환 |
특정 열에 대하여 데이터 형식, 길이, 자릿수, 코드 페이지 등의 속성을 변경 |
파생 열 |
특정 열 또는 여러 열을 이용한 계산된 열이나 문자열 함수 등을 이용한 열을 추가 |
문자표 |
특정 열에 대하여 대/소문자 변환, 바이트 반전 등과 같은 특수 연산 수행 |
열 복사
가장 단순한 열 수준의 변환 작업입니다. 입력 데이터 중, 특정 열을 단순히 다른 이름으로 복사해서 출력하는 변환입니다. 만약 원본에서 데이터를 읽어 들인 후, 여러 변환 과정을 수행 할 때, 원본 데이터의 복사본을 그대로 유지하고 싶은 경우에 사용할 수 있습니다.
데이터 변환
입력 데이터 중, 특정 열에 대한 데이터 속성을 변경할 때 사용되는 변환입니다.
상단의 사용 가능한 입력 열에서 변경을 원하는 열을 선택한 후, 아래의 속성 변경 부분에서 변경 설정을 하면 됩니다.
Ÿ 출력 별칭 – 변환 후, 출력되는 열의 이름을 정합니다. 기존 열의 대체 기능은 없으며, 새로운 열로 추가만 됩니다.
Ÿ 데이터 형식 – 변경할 데이터의 유형을 설정합니다.
Ÿ 길이 – 데이터 형식이 문자열[DT_STR], 유니코드 문자열[DT_WSTR], 바이트 스트림[DT_BYTES]인 경우, 문자열의 길이를 설정합니다.
Ÿ 전체 자릿수, 소수 자릿수 – 데이터 형식이 10진수[DT_DECIMAL], 숫자[DT_NUMERIC]인 경우, 숫자 데이터의 전체 자릿수 및 소수 자릿수를 설정합니다.
Ÿ 코드 페이지 – 데이터 형식이 문자열[DT_STR], 유니코드 문자열[DT_WSTR], 바이트 스트림[DT_BYTES], 텍스트 스트림[DT_TEXT]인 경우, 데이터의 코드 페이지를 설정합니다.
하단의 오류 출력 버튼을 클릭하여, 오류 발생 시 처리할 방법을 설정할 수 있습니다. 예를 들어, 데이터 형식을 숫자로 설정하였지만, 원본 데이터가 “abc”와 같은 문자 데이터가 들어오는 경우, 데이터 변환 작업은 오류를 발생하게 됩니다. 이 경우, 오류 데이터를 다른 경로로 출력하도록 하거나, 오류 데이터를 무시하도록 하거나, 또는 변환 작업을 실패로 처리하도록 할 수 있습니다.
파생 열
SQL에서 계산된 열(Calculated Column)과 같이 기존의 열을 이용하여 새로운 열을 정의하는 변환입니다. 예를 들어, 원본 데이터가 A, B 열로 구성이 된 경우, A+B로 정의되는 새로운 열 C를 추가하도록 지정할 때 이용할 수 있습니다.
파생 열 변환은 데이터 변환과 거의 유사합니다. 하지만, 새로운 열을 추가하는 대신 기존 열을 대체하도록 하는 바꾸기 ‘변수명’으로 설정을 할 수 있습니다. 식 속성 부분에서 해당 열에 대한 정의를 할 수 있습니다. 식은 단순히 LEFT, RIGHT 등과 같은 문자열 함수뿐만 아니라, 편집기의 오른쪽에 있는 다양한 함수들을 이용하여 생성할 수 있으며, 열 외에도 SSIS의 사용자 변수를 식에 포함시킬 수 있습니다.
길이, 전체 자릿수, 소수 자릿수, 코드 페이지 등과 같은 속성은 데이터 변환 부분과 동일합니다.
문자표
문자표 변환은 대문자를 소문자로 변환한다든지, 전자 문자를 반자 문자로 변환하는 것과 같은 문자 데이터에 대한 특수한 변환 작업을 수행할 때 사용되는 변환 개체입니다.
대상 속성을 내부 변경으로 설정하면 기존 열을 대체하게 되며, 새 열로 설정하면, 변환을 적용한 새로운 열을 추가하게 됩니다.
수행할 수 있는 연산 작업은 다음과 같습니다.
Ÿ 소문자 – 입력 열의 데이터를 모두 소문자로 변경합니다.
Ÿ 대문자 – 입력 열의 데이터를 모두 대문자로 변경합니다.
Ÿ 바이트 반전 – 바이트의 순서를 반대로 바꿉니다.
Ÿ 히라가나 – 입력 열의 데이터가 일본어인 경우 모두 히라가나로 변경합니다.
Ÿ 가타카나 – 입력 열의 데이터가 일본어인 경우 모두 가타카나로 변경합니다.
Ÿ 반자 – 전자 문자를 반자로 변경합니다.
Ÿ 전자 – 반자 문자를 전자로 변경합니다.
Ÿ 대소문자 구분 기능 – 대/소문자의 구분 기능을 적용합니다.
Ÿ 중국어 간체 – 입력 열의 데이터가 중국어인 경우 모두 간체로 변경합니다.
Ÿ 중국어 번체 – 입력 열의 데이터가 중국어인 경우 모두 번체로 변경합니다.
Ÿ
연산 작업들은 동시에 여러 개를 설정할 수 있습니다. 예를 들어 소문자와 반자, 바이트 반전 옵션을 설정할 수 있습니다. 하지만, 소문자와 대문자, 반자와 전자, 히라가나와 가타카나 등과 같이 서로 상반되는 옵션은 동시에 설정할 수는 없습니다.
'연구개발 > DTS & SSIS' 카테고리의 다른 글
기본 강좌 29 - 병합 변환 (0) | 2009.06.20 |
---|---|
기본 강좌 28 - 열 가져오기, 열 내보내기 변환 (0) | 2009.06.20 |
기본 강좌 26 - 멀티캐스트, 조건부 분할 변환 (0) | 2009.06.20 |
기본 강좌 25 - 감사 변환 (0) | 2009.06.20 |
기본 강좌 24 - UNION ALL, 정렬, 집계 변환 (0) | 2009.06.20 |