랜덤 포레스트 라이브러리를 설치하고 아래의 코드를 실행한다.
library(randomForest)
set.seed(1234)
regressor = randomForest(x = dataset[-2],
y = dataset$Salary,
ntree = 500) # 나무의 갯수
predict(regressor, data.frame(Level = 6.5))
결과 값 : 160907.7
이는 A의 말한 16만 달러와 매우 흡사한 결과다.
그래프를 그려보면,
library(ggplot2)
x_grid = seq(min(dataset$Level), max(dataset$Level), 0.01)
ggplot() +
geom_point(aes(x = dataset$Level, y = dataset$Salary),
colour = 'red') +
geom_line(aes(x = x_grid, y = predict(regressor, newdata = data.frame(Level = x_grid))),
colour = 'blue') +
ggtitle('Truth or Bluff (Random Forest Regression)') +
xlab('Level') +
ylab('Salary')
[회귀 - 16]의 결과보다 훨씬 정교한 그래프를 얻었다. 와우!
많은 나무, 많은 잎들이 있으니 더 정확한 결과가 나온 것이다.
나무가 많으면 많을수록 평균에 점점 가까운 값을 도출해낼수 있다.
'AI > 회귀' 카테고리의 다른 글
[회귀 - 19] R 제곱(R Squared)이란? (0) | 2022.04.25 |
---|---|
[회귀 - 17] 랜덤 포레스트(Random Forest)란? (0) | 2022.04.25 |
[회귀 - 16] R을 이용한 의사 결정 트리 실습 (0) | 2022.04.25 |
[회귀 - 15] 의사 결정 트리(Decision Tree)란? (0) | 2022.04.25 |
[회귀 - 14] R을 이용한 서포트 벡터 회귀 실습 (0) | 2022.04.25 |
댓글