본문 바로가기

다중 선형 회귀3

[회귀 - 9] 다중 선형 회귀 regressor = lm(formula = Profit ~ ., #.은 모든 독립변수들을 뜻 함 data = training_set) 독립 변수 : R.D.Spend(연구개발 비용), Administration(행정 비용), Marketing.Spend(마케팅 비용), State(주) 종속 변수 : Profict(이익) 이 데이터를 바탕으로 스타트업들의 미래 이익을 예측하고, 어떤 독립 변수가 이익에 가장 큰 이익을 주는지 알아내고, 어떤 부분이 이익과 독립 변수 사이의 관계를 주도하는지 하는 정보들을 알아볼 것이다. 먼저 앞서 데이터 전처리에서 배운대로 범주형 데이터를 양적 데이터로 변경해준다. 다음으로 역시 앞에서 배운대로 훈련 세트와 테스트 세트로 나눈다. 다음에 나와있는 코드로 훈련 세트를 다중.. 2022. 4. 24.
[회귀 - 6] 가변수의 함정 Profit R&D Spend Admin Marketing State 213 165 136 471 New York 251 162 151 443 California 212 153 101 407 California 261 144 118 383 New York 209 142 91 366 California 다중 선형 회귀란 독립변수가 2개 이상 있는 식이다. 만약 위 표를 선형 회귀로 만든다면 어떻게 될까? 당연히 종속변수는 Profit이 될 것이다. y = b0 + b1 * x1 + b2 * x2 + b3 * x3 + ??? 그런데 State는 어떻게 넣어야할까? (???가 State) 여기서 중요한 점은 State가 범주형 변수라는 것이다. 범주형 변수는 이 상태로 회귀식에 넣을 수 없다. State에는 .. 2022. 4. 23.
[회귀 - 1] 회귀란? 회귀란 1개 이상의 독립 변수와, 1개의 종속 변수간의 상관관계를 모델링 하는 것이다. 라고 하면 어려운데 그냥 간단히 말하면 식이다. y = a * x + b 라는 식이 있다면 y는 종속 변수, x는 독립 변수가 된다. 단순 선형 회귀란? x, 즉 독립 변수가 1개인 회귀 다중 선형 회귀란? 독립 변수가 2개 이상인 회귀 다항 회귀란? '선형'이 아닌 '곡선' 회귀를 말한다. 즉, 차수가 2 이상이다. ex) y = a * x^2 + b - 아래는 뇌피셜을 포함하고 있어 정확하지 않을 수 있음 회귀의 진짜 원래 의미는 우리가 원래 흔히 알고 있는 '돌아가다'의 뜻인 회귀가 맞다. 하지만 찾아보니 통계학의 회귀는 '평균으로 돌아가다'라는 의미를 뜻하는 것 같다. 평균으로 돌아가다라는 말은 '추세'라고도 .. 2022. 4. 17.
728x90