R 언어는 S언어를 1995년에 개선하여 만든 언어이다. 오픈소스이며, 빅터이터의 주된 분석도구가 된다. T test , 평균비교 , machine learning, anova 분석 등에 사용되며 시각화 도구로 굉장히
유용하다. 강점중의 하나는 다른 프로그램들과 연동이 쉽다는 점이다. 그리고 R base는 지속적으로 업데이트 되어진다. 또한 여러가지 추가 Package들을 설치할 수 있다. 그럼 R을 먼저 설치해보자.
R의 설치 : https://cran.r-project.org/
RStudio 설치 : https://www.RStudio.com/products/RStudio/download/
(RStudio-1.0.143.exe, 82MB)
위의 두가지 링크가 있는데, 위는 R 프로그램이고, 아래는 R언어를 유용하게 쓸 수 있는 프로그램이다. 둘다 설치를 진행하면 되고, 주의할 점은, R을 설치할때, (첫번째 링크) 구성요소 설치 화면에서 Message translations 을 빈칸으로 체크하여 설치해야한다.
이제 R Studio 프로그램을 한번 보자. 실행시키면 아래와 같은 화면이 뜬다.
맨 위 왼쪽창은 R 프로그램 입력창이다. 여기서 우리는 R 언어 코드를 작성할 수 있다. 바로 오른쪽은 R의 데이터 환경을 나타내는 창이다. 프로그램 입력창에 코드를 실행시키면 이 창에서 Output Data를 볼 수 있다. 아래 왼쪽창은 콘솔이다. 프로그램이 수행되는 과정이나 결과를 보여준다. 그 옆 아래 오른쪽 창은 패키지/그래픽/도움말 등이있다. R Studio에서 help라는 구문을 잘 이용하면 도움말 창에서 직접 원하는 정보를 얻을 수 있다. (예제도 주어진다) 그러므로 혼자 공부할때, help를 잘 사용하면, 도움이 많이 될것이다. 이 부분은 나중에 더 알아보자.
이제 R을 시작해보자. 먼저 프로그램 입력창에 다음과 같이 입력해 보자.
R에서 프로그램을 run 할때, ctrl + Enter 을 이용하면 쉽게 실행 시킬 수 있다. 먼저 6번째 줄에 x1<-c(1,3,5,7,9) 를 드래그 한 뒤 ctrl + Enter를 해보자. 그럼 콘솔 창에 아래와 같이 결과가 나온다.
우리는 x1 이라는 Numeric한 Vector값이 생성되었다.
위의 오른쪽 환경창 에서도 데이터가 형성 되었음을 볼 수 있다. 이 x1 vector의 자료형을 알고 싶다면 class(x1)을 9번째 줄과 같이 입력하면 된다. 그리고 이 자료형이 Numeric한 값인지 판별할 때, 10번째 줄과 같이 is.numeric(x1)을 입력해주고 실행시키면 된다. 결과는 다음과 같다.
x1을 numeric형으로 인식하고 그 값이 numeric임을 true값으로 판별하였다.
중간중간 # 기호는 각주을 나타낸다. 프로그램 Run에는 영향을 주지 않고, 코드를 설명하거나 참고사항등을 작성할 수 있다.
이제 코드의 12 번째부터 15째 줄을 보자. 여기서는 x1을 integer값인지 판별을 진행했다. integer값이 아니므로 false를 출력했고, 이 x1을 integer형으로 x2를 생성할 수 있다. (line 15) 결과는 아래와 같다.
위와 같이 새로운 int x2 vector가 생성됨을 볼 수 있다. 그리고 line19 에 length 구문은 x1의 길이를 판별해 주는 역할을 한다. 22번째 line에서 x1이 벡터 값인지 판단한다. line 26에서는 character 값을 판별하였다. 결과는 아래와 같다.
그다음 line 30 부터 help 에 관한 구문이 나온다. 여기는 내가 R코드를 작성하거나 분석하다가 모른 부분이 생겼을 때, help() 를 사용하여 오른쪽 아래 창에서 필요한 정보를 얻을 수 있다.
위의 내용은 포항공과대학교 인터넷 강의(MOOC)를 바탕으로 작성하였다. 매 학기마다 인터넷 무료강좌가 열리며, 일정만큼 수료를 하면 수료증도 준다.
MOOC : http://www.postechx.kr/ko
AI. 빅데이터, IoT관련 수업을 들을 수 있으므로, 참고해서 강의를 들으면 더 도움이 될 것이다.
Comentários