[회귀 - 12]에서처럼 A의 연봉 예측을 해보겠다. 이번엔 의사 결정 트리다.
바로 예측까지 해보겠다.
library(rpart) # 의사 결정 트리 라이브러리
regressor = rpart(formula = Salary ~ .,
data = dataset,
control = rpart.control(minsplit = 1)) # 분할을 많이해 정보량을 늘리는 것과 같다.
predict(regressor, data.frame(Level = 6.5)) # 6.5 수준의 연봉 예측
결과 값 : 250000
다른 모델에 비해 예측 값이 상당히 높게 나왔다. 그래프까지 확인해보자.
library(ggplot2)
x_grid = seq(min(dataset$Level), max(dataset$Level), 0.01) # 해상도를 높여주는 것과 같다.
ggplot() +
geom_point(aes(x = dataset$Level, y = dataset$Salary),
colour = 'red') +
geom_line(aes(x = x_grid, y = predict(regressor, newdata = data.frame(Level = x_grid))),
colour = 'blue') +
ggtitle('Truth or Bluff (Decision Tree Regression)') +
xlab('Level') +
ylab('Salary')
비선형적인 그래프의 모습을 확인할 수 있다.
728x90
'AI > 회귀' 카테고리의 다른 글
[회귀 - 18] R을 이용한 랜덤 포레스트 실습 (0) | 2022.04.25 |
---|---|
[회귀 - 17] 랜덤 포레스트(Random Forest)란? (0) | 2022.04.25 |
[회귀 - 15] 의사 결정 트리(Decision Tree)란? (0) | 2022.04.25 |
[회귀 - 14] R을 이용한 서포트 벡터 회귀 실습 (0) | 2022.04.25 |
[회귀 - 13] 서포트 벡터 회귀(Support Vector Regression)란? SVR (0) | 2022.04.24 |
댓글