전체 글194 [회귀 - 15] 의사 결정 트리(Decision Tree)란? 먼저 회귀 나무(Regression Trees)에 대해 알아보자. 위와 같은 산점도 그래프가 있다. 주의할 점은 가로축이 x1, 세로축이 x2이고, y축은 3차원에 표현된다는 점이다. 이 그래프에 x1 = -0.5 선을 그어보자. 그럼 이제 데이터를 x1 = -0.5를 기준으로 왼쪽 값과 오른쪽 값로 나눌 수 있을 것이다. 이제 우리는 2개의 정보를 갖게 된 것이다. 이 말을 정리하면, 기준선을 그을수록 우리의 정보량이 늘어난다는 뜻이다. 그리고 이렇게 갈라진 정보를 '잎'이라고 한다. 이것을 회귀 나무로 표현하면 아래와 같다. 이제 다시 x2 = 1(x1 < -0.5)선을 그어보자. 이제 슬슬 감이 올 것이다. 다시 이것을 회귀 나무로 표현해보자. 그리고 독립 변수(파란점)들에 의해 결정되는 종속 변수.. 2022. 4. 25. [회귀 - 14] R을 이용한 서포트 벡터 회귀 실습 https://nhahan.tistory.com/30 2022. 4. 25. [회귀 - 13] 서포트 벡터 회귀(Support Vector Regression)란? SVR 회귀선이 있고, 회귀선을 중심으로 튜브가 그려진다.이 튜브 안에 있는 데이터들에 대해서는 오차 범위 안의 정상 데이터로 판단하고, 밖에 있는 데이터들을 Support Vector라고 한다.그리고 튜브와 가까운 데이터들은 Potential Support Vector라고 한다.그러나 위 그래프는 선형 SVR의 경우이고, 비선형일 경우엔 3차원으로 넘어가기 때문에... 이런게 있다 정도만 알아두자. 2022. 4. 24. [회귀 - 12] R을 이용한 다항 회귀 실습 새 직원을 뽑으려고 하는데 이 직원을 A라고 하겠다. A는 20년의 경력을 가지고 있고 이전 회사에서 16만 달러의 연봉을 받았다고 말하고 있다. 그리고 이전 회사에서는 Region Manager 직급으로 2년간 일했다고 하고 있다. 그럼 이 직원에게 제시 될 연봉은 6행과 7행 사이의 어딘가가 될 것이다. (이를 대강 6.5 수준의 급여라고 하겠다) 다중 회귀를 통해서 위 내용이 사실인지 거짓인지 알아보자. 일단 Position과 Level은 사실상 같은 내용이기 때문에 2, 3열만 가지고 모델을 만들 것이다. dataset = dataset[2:3] 데이터 세트가 작으니 이번에는 훈련 세트와 테스트 세트를 나누지 않고 진행할 예정이다. 이 데이터 세트에 선형 회귀가 어울릴지, 다항 회귀가 어울릴지 .. 2022. 4. 24. [회귀 - 11] 다항 회귀(Polynomial Linear Regression)란? 다항 회귀는 2차식 이상인 모델을 말한다. 근데 Polynomial Linear Regression이라는 단어를 보면 'Linear(직선)'가 포함되어 있다. 곡선인데 웬 직선? 그 이유는 여기서의 Linear 뜻하는 건 계수가 선형적이냐 비선형적이냐를 말하는 것이기 때문이다. y = b0 + b1 * x1 + b2 * x2^2 + ... + bn * x^n 즉 여기서 계수인 b0, b1, ..., bn이 선형이라는 뜻이다. 비선형의 예시 y = (b0 + b1 * x1) / (b2 * x2) 2022. 4. 24. 이전 1 ··· 31 32 33 34 35 36 37 ··· 39 다음 728x90