R 샘플 데이터 불러오기
R로 데이터를 분석하기 위해서는 일단 데이터를 R에 불러와야 한다. 데이터를 어디서 불러오느냐에 따라 방법이 다양하지만 가장 간단하게 R 샘플 데이터를 가져오는 방법부터 포스팅 해본다.
▼ 로컬 PC에 있는 CSV TSV TXT 파일 불러오기 ▼
2017/03/26 - [Analysis/R] - 로컬에서 데이터 불러오기 / 데이터 저장하기
(1) R 샘플 데이터 목록 확인하기
R에는 자체적으로 제공하는 샘플 데이터가 많이 있다.
본인이 가지고 있는 데이터가 없다면 우선은 이 데이터들을 사용해 보자.
> data()위 코드를 실행하면 R data sets 라는 탭이 새로 뜨면서 R에서 제공하고 있는 샘플 데이터 목록을 확인할 수 있다.
(2) R 샘플 데이터 불러오기 - iris
R에서 제공하는 샘플 데이터 중 iris 데이터는 마치 C에서 Hello World 같은 존재이다.
대부분의 예제들이 이 데이터를 활용하는 코드로 되어 있고 나도 새로운 함수나 코드를 테스트 해볼 때는 여전히 iris 데이터를 많이 사용하고 있다.
R에서 제공하는 샘플 데이터는 따로 불러오는 코드를 작성할 필요 없이 바로 사용할 수 있다. (자세한 내용은 아래에...)
(3) head 함수
iris를 불러오는 별도의 코드 없이 바로 아래를 작성한다.
head( ) 함수는 데이터를 위에서부터 기본 6줄 보여주는 함수인데, head( ) 함수를 이용해서 iris 데이터의 내용을 살펴보자.
> head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosairis 데이터는 Sepal.Length, Sepal.Width, Petal.Length, Petal.Width, Species 5개의 컬럼(변수)로 이루어져 있다는 것을 확인할 수 있다.
- -(4) str 함수
str( ) 함수는 데이터의 구조를 보여주는 함수인데, str( ) 함수를 이용해서 iris 데이터의 구조를 살펴보자.
iris 데이터는 데이터 타입이 data.frame이다.
그리고 150개의 행 (또는 row 또는 observation) 과 5개의 열( 또는 column, 또는 변수 variables) 로 이루어져 있다는 것을 맨 첫 줄에서 확인할 수 있다.
$ 뒤에 따라오는 것들은 iris 데이터를 이루는 변수명이고 num 또는 Factor는 각 변수의 변수형을 보여준다.
변수형 옆으로는 어떤 값으로 이루어져 있는지 샘플을 보여주는 형식이다.
데이터 타입과 변수형, 그리고 데이터를 다루는 다른 함수들은 따로 포스팅할 예정이다.
> iris3
, , Setosa
Sepal L. Sepal W. Petal L. Petal W.
[1,] 5.1 3.5 1.4 0.2
[2,] 4.9 3.0 1.4 0.2
[3,] 4.7
3.2 1.3 0.2
[4,] 4.6 3.1 1.5 0.2
[5,] 5.0 3.6 1.4 0.2
[6,] 5.4 3.9 1.7
0.4
[7,] 4.6 3.4 1.4 0.3
[8,] 5.0 3.4 1.5 0.2
[9,] 4.4 2.9 1.4 0.2
[10,]
4.9 3.1 1.5 0.1
[11,] 5.4 3.7 1.5 0.2
[12,] 4.8 3.4 1.6 0.2
[13,] 4.8 3.0
1.4 0.1
[14,] 4.3 3.0 1.1 0.1
[15,] 5.8 4.0 1.2 0.2
[16,] 5.7 4.4 1.5 0.4
[17,]
5.4 3.9 1.3 0.4
[18,] 5.1 3.5 1.4 0.3
[19,] 5.7 3.8 1.7 0.3
[20,] 5.1 3.8
1.5 0.3
[21,] 5.4 3.4 1.7 0.2
[22,] 5.1 3.7 1.5 0.4
[23,] 4.6 3.6 1.0 0.2
[24,]
5.1 3.3 1.7 0.5
[25,] 4.8 3.4 1.9 0.2
[26,] 5.0 3.0 1.6 0.2
[27,] 5.0 3.4
1.6 0.4
[28,] 5.2 3.5 1.5 0.2
[29,] 5.2 3.4 1.4 0.2
[30,] 4.7 3.2 1.6 0.2
[31,]
4.8 3.1 1.6 0.2
[32,] 5.4 3.4 1.5 0.4
[33,] 5.2 4.1 1.5 0.1
[34,] 5.5 4.2
1.4 0.2
[35,] 4.9 3.1 1.5 0.2
[36,] 5.0 3.2 1.2 0.2
[37,] 5.5 3.5 1.3 0.2
[38,]
4.9 3.6 1.4 0.1
[39,] 4.4 3.0 1.3 0.2
[40,] 5.1 3.4 1.5 0.2
[41,] 5.0 3.5
1.3 0.3
[42,] 4.5 2.3 1.3 0.3
[43,] 4.4 3.2 1.3 0.2
[44,] 5.0 3.5 1.6 0.6
[45,]
5.1 3.8 1.9 0.4
[46,] 4.8 3.0 1.4 0.3
[47,] 5.1 3.8 1.6 0.2
[48,] 4.6 3.2
1.4 0.2
[49,] 5.3 3.7 1.5 0.2
[50,] 5.0 3.3 1.4 0.2
, , Versicolor
Sepal L. Sepal W. Petal L. Petal W.
[1,] 7.0
3.2 4.7 1.4
[2,] 6.4 3.2 4.5 1.5
[3,] 6.9 3.1 4.9 1.5
[4,] 5.5 2.3 4.0
1.3
[5,] 6.5 2.8 4.6 1.5
[6,] 5.7 2.8 4.5 1.3
[7,] 6.3 3.3 4.7 1.6
[8,]
4.9 2.4 3.3 1.0
[9,] 6.6 2.9 4.6 1.3
[10,] 5.2 2.7 3.9 1.4
[11,] 5.0 2.0
3.5 1.0
[12,] 5.9 3.0 4.2 1.5
[13,] 6.0 2.2 4.0 1.0
[14,] 6.1 2.9 4.7 1.4
[15,]
5.6 2.9 3.6 1.3
[16,] 6.7 3.1 4.4 1.4
[17,] 5.6 3.0 4.5 1.5
[18,] 5.8 2.7
4.1 1.0
[19,] 6.2 2.2 4.5 1.5
[20,] 5.6 2.5 3.9 1.1
[21,] 5.9 3.2 4.8 1.8
[22,]
6.1 2.8 4.0 1.3
[23,] 6.3 2.5 4.9 1.5
[24,] 6.1 2.8 4.7 1.2
[25,] 6.4 2.9
4.3 1.3
[26,] 6.6 3.0 4.4 1.4
[27,] 6.8 2.8 4.8 1.4
[28,] 6.7 3.0 5.0 1.7
[29,] 6.0
2.9 4.5 1.5
[30,] 5.7 2.6 3.5 1.0
[31,] 5.5 2.4 3.8 1.1
[32,] 5.5 2.4 3.7
1.0
[33,] 5.8 2.7 3.9 1.2
[34,] 6.0 2.7 5.1 1.6
[35,] 5.4 3.0 4.5 1.5
[36,] 6.0
3.4 4.5 1.6
[37,] 6.7 3.1 4.7 1.5
[38,] 6.3 2.3 4.4 1.3
[39,] 5.6 3.0 4.1
1.3
[40,] 5.5 2.5 4.0 1.3
[41,] 5.5 2.6 4.4 1.2
[42,] 6.1 3.0 4.6 1.4
[43,] 5.8
2.6 4.0 1.2
[44,] 5.0 2.3 3.3 1.0
[45,] 5.6 2.7 4.2 1.3
[46,] 5.7 3.0 4.2
1.2
[47,] 5.7 2.9 4.2 1.3
[48,] 6.2 2.9 4.3 1.3
[49,] 5.1 2.5 3.0 1.1
[50,] 5.7
2.8 4.1 1.3
, , Virginica
Sepal L. Sepal W. Petal L. Petal W.
[1,] 6.3 3.3 6.0 2.5
[2,] 5.8 2.7 5.1 1.9
[3,]
7.1 3.0 5.9 2.1
[4,] 6.3 2.9 5.6 1.8
[5,] 6.5 3.0 5.8 2.2
[6,] 7.6 3.0
6.6 2.1
[7,] 4.9 2.5 4.5 1.7
[8,] 7.3 2.9 6.3 1.8
[9,] 6.7 2.5 5.8 1.8
[10,] 7.2 3.6 6.1 2.5
[11,] 6.5 3.2 5.1 2.0
[12,] 6.4 2.7 5.3 1.9
[13,] 6.8
3.0 5.5 2.1
[14,] 5.7 2.5 5.0 2.0
[15,] 5.8 2.8 5.1 2.4
[16,] 6.4 3.2 5.3
2.3
[17,] 6.5 3.0 5.5 1.8
[18,] 7.7 3.8 6.7 2.2
[19,] 7.7 2.6 6.9 2.3
[20,] 6.0
2.2 5.0 1.5
[21,] 6.9 3.2 5.7 2.3
[22,] 5.6 2.8 4.9 2.0
[23,] 7.7 2.8 6.7
2.0
[24,] 6.3 2.7 4.9 1.8
[25,] 6.7 3.3 5.7 2.1
[26,] 7.2 3.2 6.0 1.8
[27,] 6.2
2.8 4.8 1.8
[28,] 6.1 3.0 4.9 1.8
[29,] 6.4 2.8 5.6 2.1
[30,] 7.2 3.0 5.8
1.6
[31,] 7.4 2.8 6.1 1.9
[32,] 7.9 3.8 6.4 2.0
[33,] 6.4 2.8 5.6 2.2
[34,] 6.3
2.8 5.1 1.5
[35,] 6.1 2.6 5.6 1.4
[36,] 7.7 3.0 6.1 2.3
[37,] 6.3 3.4 5.6
2.4
[38,] 6.4 3.1 5.5 1.8
[39,] 6.0 3.0 4.8 1.8
[40,] 6.9 3.1 5.4 2.1
[41,] 6.7
3.1 5.6 2.4
[42,] 6.9 3.1 5.1 2.3
[43,] 5.8 2.7 5.1 1.9
[44,] 6.8 3.2 5.9
2.3
[45,] 6.7 3.3 5.7 2.5
[46,] 6.7 3.0 5.2 2.3
[47,] 6.3 2.5 5.0 1.9
[48,] 6.5
3.0 5.2 2.0
[49,] 6.2 3.4 5.4 2.3
[50,] 5.9 3.0 5.1 1.8
> data("iris3")
> iris3
, , Setosa
Sepal L. Sepal W. Petal L. Petal
W.
[1,] 5.1 3.5 1.4 0.2
[2,] 4.9 3.0 1.4 0.2
[3,] 4.7 3.2 1.3 0.2
[4,]
4.6 3.1 1.5 0.2
[5,] 5.0 3.6 1.4 0.2
[6,] 5.4 3.9 1.7 0.4
[7,] 4.6 3.4
1.4 0.3
[8,] 5.0 3.4 1.5 0.2
[9,] 4.4 2.9 1.4 0.2
[10,] 4.9 3.1 1.5 0.1
[11,] 5.4 3.7 1.5 0.2
[12,] 4.8 3.4 1.6 0.2
[13,] 4.8 3.0 1.4 0.1
[14,] 4.3
3.0 1.1 0.1
[15,] 5.8 4.0 1.2 0.2
[16,] 5.7 4.4 1.5 0.4
[17,] 5.4 3.9 1.3
0.4
[18,] 5.1 3.5 1.4 0.3
[19,] 5.7 3.8 1.7 0.3
[20,] 5.1 3.8 1.5 0.3
[21,] 5.4
3.4 1.7 0.2
[22,] 5.1 3.7 1.5 0.4
[23,] 4.6 3.6 1.0 0.2
[24,] 5.1 3.3 1.7
0.5
[25,] 4.8 3.4 1.9 0.2
[26,] 5.0 3.0 1.6 0.2
[27,] 5.0 3.4 1.6 0.4
[28,] 5.2
3.5 1.5 0.2
[29,] 5.2 3.4 1.4 0.2
[30,] 4.7 3.2 1.6 0.2
[31,] 4.8 3.1 1.6
0.2
[32,] 5.4 3.4 1.5 0.4
[33,] 5.2 4.1 1.5 0.1
[34,] 5.5 4.2 1.4 0.2
[35,] 4.9
3.1 1.5 0.2
[36,] 5.0 3.2 1.2 0.2
[37,] 5.5 3.5 1.3 0.2
[38,] 4.9 3.6 1.4
0.1
[39,] 4.4 3.0 1.3 0.2
[40,] 5.1 3.4 1.5 0.2
[41,] 5.0 3.5 1.3 0.3
[42,] 4.5
2.3 1.3 0.3
[43,] 4.4 3.2 1.3 0.2
[44,] 5.0 3.5 1.6 0.6
[45,] 5.1 3.8 1.9
0.4
[46,] 4.8 3.0 1.4 0.3
[47,] 5.1 3.8 1.6 0.2
[48,] 4.6 3.2 1.4 0.2
[49,] 5.3
3.7 1.5 0.2
[50,] 5.0 3.3 1.4 0.2
, , Versicolor
Sepal L. Sepal W. Petal L. Petal W.
[1,] 7.0 3.2 4.7 1.4
[2,]
6.4 3.2 4.5 1.5
[3,] 6.9 3.1 4.9 1.5
[4,] 5.5 2.3 4.0 1.3
[5,] 6.5 2.8
4.6 1.5
[6,] 5.7 2.8 4.5 1.3
[7,] 6.3 3.3 4.7 1.6
[8,] 4.9 2.4 3.3 1.0
[9,] 6.6 2.9 4.6 1.3
[10,] 5.2 2.7 3.9 1.4
[11,] 5.0 2.0 3.5 1.0
[12,] 5.9
3.0 4.2 1.5
[13,] 6.0 2.2 4.0 1.0
[14,] 6.1 2.9 4.7 1.4
[15,] 5.6 2.9 3.6
1.3
[16,] 6.7 3.1 4.4 1.4
[17,] 5.6 3.0 4.5 1.5
[18,] 5.8 2.7 4.1 1.0
[19,] 6.2
2.2 4.5 1.5
[20,] 5.6 2.5 3.9 1.1
[21,] 5.9 3.2 4.8 1.8
[22,] 6.1 2.8 4.0
1.3
[23,] 6.3 2.5 4.9 1.5
[24,] 6.1 2.8 4.7 1.2
[25,] 6.4 2.9 4.3 1.3
[26,] 6.6
3.0 4.4 1.4
[27,] 6.8 2.8 4.8 1.4
[28,] 6.7 3.0 5.0 1.7
[29,] 6.0 2.9 4.5
1.5
[30,] 5.7 2.6 3.5 1.0
[31,] 5.5 2.4 3.8 1.1
[32,] 5.5 2.4 3.7 1.0
[33,] 5.8
2.7 3.9 1.2
[34,] 6.0 2.7 5.1 1.6
[35,] 5.4 3.0 4.5 1.5
[36,] 6.0 3.4 4.5
1.6
[37,] 6.7 3.1 4.7 1.5
[38,] 6.3 2.3 4.4 1.3
[39,] 5.6 3.0 4.1 1.3
[40,] 5.5
2.5 4.0 1.3
[41,] 5.5 2.6 4.4 1.2
[42,] 6.1 3.0 4.6 1.4
[43,] 5.8 2.6 4.0
1.2
[44,] 5.0 2.3 3.3 1.0
[45,] 5.6 2.7 4.2 1.3
[46,] 5.7 3.0 4.2 1.2
[47,] 5.7
2.9 4.2 1.3
[48,] 6.2 2.9 4.3 1.3
[49,] 5.1 2.5 3.0 1.1
[50,] 5.7 2.8 4.1
1.3
, , Virginica
Sepal L. Sepal W. Petal L. Petal W.
[1,] 6.3 3.3 6.0 2.5
[2,] 5.8 2.7 5.1 1.9
[3,] 7.1 3.0
5.9 2.1
[4,] 6.3 2.9 5.6 1.8
[5,] 6.5 3.0 5.8 2.2
[6,] 7.6 3.0 6.6 2.1
[7,] 4.9 2.5 4.5 1.7
[8,] 7.3 2.9 6.3 1.8
[9,] 6.7 2.5 5.8 1.8
[10,] 7.2
3.6 6.1 2.5
[11,] 6.5 3.2 5.1 2.0
[12,] 6.4 2.7 5.3 1.9
[13,] 6.8 3.0 5.5
2.1
[14,] 5.7 2.5 5.0 2.0
[15,] 5.8 2.8 5.1 2.4
[16,] 6.4 3.2 5.3 2.3
[17,] 6.5
3.0 5.5 1.8
[18,] 7.7 3.8 6.7 2.2
[19,] 7.7 2.6 6.9 2.3
[20,] 6.0 2.2 5.0
1.5
[21,] 6.9 3.2 5.7 2.3
[22,] 5.6 2.8 4.9 2.0
[23,] 7.7 2.8 6.7 2.0
[24,] 6.3
2.7 4.9 1.8
[25,] 6.7 3.3 5.7 2.1
[26,] 7.2 3.2 6.0 1.8
[27,] 6.2 2.8 4.8
1.8
[28,] 6.1 3.0 4.9 1.8
[29,] 6.4 2.8 5.6 2.1
[30,] 7.2 3.0 5.8 1.6
[31,] 7.4
2.8 6.1 1.9
[32,] 7.9 3.8 6.4 2.0
[33,] 6.4 2.8 5.6 2.2
[34,] 6.3 2.8 5.1
1.5
[35,] 6.1 2.6 5.6 1.4
[36,] 7.7 3.0 6.1 2.3
[37,] 6.3 3.4 5.6 2.4
[38,] 6.4
3.1 5.5 1.8
[39,] 6.0 3.0 4.8 1.8
[40,] 6.9 3.1 5.4 2.1
[41,] 6.7 3.1 5.6
2.4
[42,] 6.9 3.1 5.1 2.3
[43,] 5.8 2.7 5.1 1.9
[44,] 6.8 3.2 5.9 2.3
[45,] 6.7
3.3 5.7 2.5
[46,] 6.7 3.0 5.2 2.3
[47,] 6.3 2.5 5.0 1.9
[48,] 6.5 3.0 5.2
2.0
[49,] 6.2 3.4 5.4 2.3
[50,] 5.9 3.0 5.1 1.8