본문 바로가기

AI44

[분류 - 10] 베이즈 정리(Bayes Theorem) 상품을 1시간에 30개를 만드는 기계A와 상품을 1시간에 20개를 만드는 기계B가 있다. 기계A와 B를 가동시켜서 상품을 1000개를 만들었는데, 불량 상품은 총 상품의 1%인 10개였다. 그런데 불량 상품의 50%는 기계A, 나머지 50%는 기계B의 불량이라고 한다. 즉 A기계에서 5개, B기계에서 5개의 불량 상품이 나왔다. 그렇다면 기계B에서 만들어진 상품이 불량일 확률은 얼마일까? P(A) = 30 / 50 = 0.6 상품이 A일 확률 P(B) = 20 / 50 = 0.4 상품이 B일 확률 P(D) = 0.01 상품이 불량일 확률 P(A | D) = 0.5 불량 상품이 A일 확률 P(B | D) = 0.5 불량 상품이 B일 확률 P(D | B) = ? B가 불량일 확률 우선 기계B와 관련된 확률이.. 2022. 5. 1.
[분류 - 9] 비선형 커널 SVM 실습 데이터 세트는 쓰던 걸 쓰고, classifier를 만든다. library(e1071) classifier = svm(formula = Purchased ~ ., data = training_set, type = 'C-classification', kernel = 'radial') 더보기 library(ElemStatLearn) set = training_set X1 = seq(min(set[, 1]) - 1, max(set[, 1]) + 1, by = 0.01) X2 = seq(min(set[, 2]) - 1, max(set[, 2]) + 1, by = 0.01) grid_set = expand.grid(X1, X2) colnames(grid_set) = c('Age', 'EstimatedSalary'.. 2022. 4. 30.
[분류 - 8 ] 비선형 커널 SVR 중간 과정을 정확히 이해를 잘 못해서 내가 받은 느낌만 적어보려고 한다. 왼쪽과 같은 그래프가 있고(노란점 참고), 커널 함수로 3차원 그래프를 만든다 그곳에 비스듬한 초평면을 투과시키고, 생긴 추세선의 튜브를 만들기 위해 평행한 초평면 2개를 더 만든다. 그렇게 생긴 2차원의 단면이 SVR이 되고, 이 SVR에 가까운 점들이 서포트 벡터가 된다. 2022. 4. 30.
[분류 - 7] Kernel SVM이란? 결정 경계(Decision Boundary)를 긋지 못하는 데이터에 대해서는 어떻게 해야할까? 1. 고차원으로의 매핑 제곱을 해서 분리하는 방법이다. 이런 느낌이라고 보면 된다. 그러나 이 방법은 연산에 오랜 시간이 걸리므로 그렇게 좋은 방법은 아니다. 2. 커널 트릭 식의 좌항은 초록색 점들이 모인 구역을 뜻한다. l은 초록색 점들의 중심, x는 초록색 점의 위치 벡터이다. 식이 어렵게 보이지만, 교양 수준에서 해석을 해보면 x-l즉, 초록색 점의 위치에서 중심점의 위치의 거리가 멀면 멀수록 K가 작아진단 뜻이다. 즉 K > 0인 구간에 데이터들에 대해서 초록색 점으로 판단하겠다는 뜻이다. σ는 원의 크기를 뜻한다. 실제로 커널은 이것보다 훨씬 다양한 종류들이 있다. 2022. 4. 30.
[분류 - 6] SVM 실습 앞의 진행과 비슷하기 때문에 코드는 더접기에 붙여넣고 생략. 더보기 # Importing the dataset dataset = read.csv('Social_Network_Ads.csv') dataset = dataset[3:5] # Encoding the target feature as factor dataset$Purchased = factor(dataset$Purchased, levels = c(0, 1)) # Splitting the dataset into the Training set and Test set # install.packages('caTools') library(caTools) set.seed(123) split = sample.split(dataset$Purchased, Spli.. 2022. 4. 30.