본문 바로가기

AI45

[분류 - 11] 나이브 베이즈 분류(Naive Bayes Classifier)란? 나이브 베이즈 분류는 베이즈 정리를 이용한 Classifer이다. 새로운 데이터(회색점) X가 들어왔을 때 이 데이터가 Walks에 속할지, Drives에 속할지 어떻게 알 수 있을까? 나이브 베이즈 분류를 이용해 분류해볼건데, 이를 위해서는 X가 Walks에 속할 확률과 X가 Drives에 속할 확률을 베이즈 정리를 2번 적용해 구해야한다. Walks일 확률은 P(Walks) = 10 / 30 P(X)를 구하기 위해서 임의의 원을 그리는데 이 원의 크기는 아무렇게나 해도 상관없다. P(X)는 X가 이 원 안에 속할 확률이므로 P(X) = 4 / 30 P(X | Walks)는 걷는 사람들 중에 원 안에 속해있을 확률이다. P(X | Walks) = 3 / 10 이제 우리는 P(Walks | X)를 구할 .. 2022. 5. 1.
[분류 - 10] 베이즈 정리(Bayes Theorem) 상품을 1시간에 30개를 만드는 기계A와 상품을 1시간에 20개를 만드는 기계B가 있다. 기계A와 B를 가동시켜서 상품을 1000개를 만들었는데, 불량 상품은 총 상품의 1%인 10개였다. 그런데 불량 상품의 50%는 기계A, 나머지 50%는 기계B의 불량이라고 한다. 즉 A기계에서 5개, B기계에서 5개의 불량 상품이 나왔다. 그렇다면 기계B에서 만들어진 상품이 불량일 확률은 얼마일까? P(A) = 30 / 50 = 0.6 상품이 A일 확률 P(B) = 20 / 50 = 0.4 상품이 B일 확률 P(D) = 0.01 상품이 불량일 확률 P(A | D) = 0.5 불량 상품이 A일 확률 P(B | D) = 0.5 불량 상품이 B일 확률 P(D | B) = ? B가 불량일 확률 우선 기계B와 관련된 확률이.. 2022. 5. 1.
[분류 - 9] 비선형 커널 SVM 실습 데이터 세트는 쓰던 걸 쓰고, classifier를 만든다. library(e1071) classifier = svm(formula = Purchased ~ ., data = training_set, type = 'C-classification', kernel = 'radial') 더보기 library(ElemStatLearn) set = training_set X1 = seq(min(set[, 1]) - 1, max(set[, 1]) + 1, by = 0.01) X2 = seq(min(set[, 2]) - 1, max(set[, 2]) + 1, by = 0.01) grid_set = expand.grid(X1, X2) colnames(grid_set) = c('Age', 'EstimatedSalary'.. 2022. 4. 30.
[분류 - 8 ] 비선형 커널 SVR 중간 과정을 정확히 이해를 잘 못해서 내가 받은 느낌만 적어보려고 한다. 왼쪽과 같은 그래프가 있고(노란점 참고), 커널 함수로 3차원 그래프를 만든다 그곳에 비스듬한 초평면을 투과시키고, 생긴 추세선의 튜브를 만들기 위해 평행한 초평면 2개를 더 만든다. 그렇게 생긴 2차원의 단면이 SVR이 되고, 이 SVR에 가까운 점들이 서포트 벡터가 된다. 2022. 4. 30.
[분류 - 7] Kernel SVM이란? 결정 경계(Decision Boundary)를 긋지 못하는 데이터에 대해서는 어떻게 해야할까? 1. 고차원으로의 매핑 제곱을 해서 분리하는 방법이다. 이런 느낌이라고 보면 된다. 그러나 이 방법은 연산에 오랜 시간이 걸리므로 그렇게 좋은 방법은 아니다. 2. 커널 트릭 식의 좌항은 초록색 점들이 모인 구역을 뜻한다. l은 초록색 점들의 중심, x는 초록색 점의 위치 벡터이다. 식이 어렵게 보이지만, 교양 수준에서 해석을 해보면 x-l즉, 초록색 점의 위치에서 중심점의 위치의 거리가 멀면 멀수록 K가 작아진단 뜻이다. 즉 K > 0인 구간에 데이터들에 대해서 초록색 점으로 판단하겠다는 뜻이다. σ는 원의 크기를 뜻한다. 실제로 커널은 이것보다 훨씬 다양한 종류들이 있다. 2022. 4. 30.
728x90