top of page
  • 작성자 사진JC.kim

[JMP] Data의 구분과 특징 (data type)


이번에는 통계에 있어서 Data를 어떻게 구분하고 구분한 Data에 어떤 통계분석을 해야하는지 알아보도록 하자. 일단 Data는 크게 두가지 유형으로 나눌 수 있다. 먼저 수치형인 양적자료(Numeric data)와 범주형인 질적자료(Character)로 나눌수 있다. Numeric data에는 두가지 유형의 data가 있는데, 하나는 연속형 (Continuous)와 이산형(Discrete)이다. JMP에서는 Discrete와 Continuous를 따로 구분하지 않고 Numeric과 Continuous를 같은 형태의 자료형으로 본다. Discrete type은 Character data 가 쌓여 형성한 type으로 볼 수 있다. 질적자료에는 순위형(Ordinal)과 명목형(Nominal) 자료가 있다. JMP프로그램에서는 Character에서 이 두가지 형태를 구분한다. 그래서 JMP프로그램에서 데이터는 총 3가지의 형태로 구분해서 분류한다. 이런 데이터의 형태의 특징을 아래에 간략히 정리하였다.


수치형 자료 (Numeric)

- 연속형 자료 (Continuous) : 관측이 가능한 값이 연속적인 자료

Ex) 월급, 제품의 길이, 제품 강도, 몸무게, 성적, 밝기 등

- 이산형 자료 (Discrete) : 관측가능한 값이 셀수 있지만 연속형이 아닌 경우

Ex) 물품 갯수, 인원 수, 불량품목 갯수, 매장 수, 일자 등


범주형 자료 (Character)

- 순위형 자료 (Ordinal) : 관측값의 크기는 의마가 없으나 방향성이나 순서를 가지고 있는 자료

Ex) 석차, 학점, 제품 등급 등

- 명목형 자료 (Nominal) : 관측 값들이 숫자적으로 표현이 어려운 자료

Ex) 성별, 부서, 물품 분류, 지역 등


JMP에서는 Ordinal을 초록색, Nominal을 빨간색, Continuous를 파란색 아이콘으로 표현한다.

Data Type이 중요한 이유는 간단하다. 바로 데이터 유형마다 적용되는 통계분석 기법이 달라지기 때문이다. 우리는 분석 전, Data가 어떤형태의 Type을 가지고 있는지, 파악할 필요가 있다. 간단하게 JMP 프로그램에서 Analyze의 [Fit Y by X] 를 이용해 어떻게 분석이 달라지는지 확인해 보자. 먼저 JMP 프로그램을 실행해보자

Data는 이노벨류파트너즈 에서 제공된 회원고객판매데이터 이다.

이번 예제를 들기 위해 '회원고객판매데이터'를 이용하였다. 매장별 회원들이 어떤물건을 어떤금액에 구매했는지 보여주는 데이터이다.

위의 사진 같이 [Analyze]-[Fit Y by X] 를 눌러보면, 아래와 같은 창이 뜬다. 여기서 X (input)에 수치형 데이터인 '구매수량' 을 넣고, Y(Response)에 범주형 데이터인 '매장 번호'를 넣어 본다.

그럼 프로그램은 아래처럼 Logistic Regression 분석을 실시한다. 그리고 이를 바꾸어 X에 '매장번호'를, Y에 '구매수량'을 넣어보자. 결과는 아래와 같이 Oneway 분석을 실시하였다. JMP 프로그램은 이와 같이 Data type에 따라 자동적으로 data 분석을 실시하므로, Data를 처리 할 때, Data의 Type을 확인해 보는것이 매우 중요하다. 이는 JMP 프로그램 뿐만 아니라, 다른 통계분석 도구에서도 마찬가지 이다.

첫번째 그림은 X값에 수치형, Y값에 범주형을 넣었을때, 두번째 그림은 그 반대로 넣었을 때 그림이다.

기본적으로 통계분석에서는 주로 연속형 Data에 대해 많이 다루어 볼 것이다. 다음에는 연속형 데이터의 특징과 기술통계량을 직접 계산해 보도록 해볼 것이다. JMP프로그램은 30일 동안 무료로 이용이 가능하며, 교육기간동안 이노벨류에서 제공하는 교육용 JMP프로그램을 사용하였다. JMP프로그램은 통계분석의 결과를 분석자가 확인하기 쉽게 Data를 가시화 시키는데 매우 특화되어있는 프로그램이다. R이나 다른 프로그램처럼 조작도 어렵지 않아 조금만 익히면 쉽게 누구든지, 정형데이터를 분석할 수 있다.


JMP 프로그램 설명 및 다운로드 : https://www.jmp.com/ko_kr/home.html


교육은 이노벨류파트너즈의 배용섭 박사님께서 직접 해주셨다. 국내에는 민간자격증으로 시험을 볼 수있으며, CDAJ (Certified Data Analyst using JMP) 자격증을 취득할 수 있다.


CDAJ 교육 문의 (이노벨류 파트너즈) : http://www.innovalue.co.kr/


조회수 851회댓글 0개

최근 게시물

전체 보기

bottom of page