여러 함수들

iris는 R에 기본으로 내장되어 있는 데이터셋이다. 해당 데이터셋으로 여러가지 문법 연습을 할 수 있다.
iris는 dataframe으로, 출력해보면 위와 같은 내용을 확인할 수 있다.
dim(iris) # 행과 열 개수
nrow(iris) # 행 개수
ncol(iris) # 열 개수
colnames(iris) # 열 이름
head(iris) # 데이터셋의 앞부분 일부 출력
tail(iris) # 데이터셋의 뒷부분 일부 출력

위와 같은 함수들로 데이터셋의 여러 정보들을 알 수 있다.
str(iris) # 데이터셋 요약 정보
iris[c(1:5), c(2,3)] # 특정 행과 열만 출력
unique(iris[, 5]) # 중복 제거 종류 보기
table(iris[, "Species"]) # 품종 종류별 행의 수

데이터셋의 정보나 특정 행과 열만 가져오기 등의 기능을 수행할 수 있다.
colSums(iris[,-5]) # 열별 합계 (문자열 제외하고)
colSums(iris[,-5]) # 열별 평균 (문자열 제외하고)
colSums(iris[,-5]) # 행별 합계 (문자열 제외하고)
colSums(iris[,-5]) # 행별 평균 (문자열 제외하고)

열별, 행별 합계, 평균을 구할 수 있다.
class(iris)
is.data.frame(iris) # 데이터프레임인가?
is.matrix(iris) # 매트릭스인가?

해당 데이터셋이 어떤 자료구조이고, 특정 자료구조인지 확인하는 함수이다.
Matrix -> DataFrame 변환
my.iris <- as.matrix(iris[-5]) # 문자열 제외하고
head(my.iris)
class(my.iris)
my.iris <- as.matrix(iris) # 문자열 포함
head(my.iris)
class(my.iris)

데이터프레임을 매트릭스로 변환할 수 있다. iris로 테스트해봤는데 주의해야 할 점은 matrix는 단일 자료형만을 가진다는 점이다. iris는 숫자와 문자로 이루어져있기 때문에 5열인 Species를 제외하고 matrix로 변환해야 숫자형인 데이터만을 가지는 matrix로 변환할 수 있다. 그렇지 않으면 모두 문자열로 변환된다.
DataFrame -> Matrix 변환
my.mat <- matrix(c(1:10), nrow = 2, ncol = 5)
my.mat
class(my.mat)
my.data <- data.frame(my.mat) # 데이터프레임으로 변경
my.data
class(my.data)

Matrix에서 DataFrame으로 변경은 반대의 경우와는 달리 그냥 하면 된다.
'공부 > 빅데이터' 카테고리의 다른 글
| [빅데이터][R] 리스트, 팩터, 매트릭스, 데이터프레임 (0) | 2024.04.10 |
|---|---|
| [빅데이터][R] 기초 (명령문, 변수, 산술 연산 등) (0) | 2024.04.07 |