목록분류 전체보기 (427)
안 쓰던 블로그
평가 1. 정확도(Accuracy) 2. 오차행렬(Confusion Matrix) 3. 정밀도(Precision) 4. 재현율(Recall) 5. F1 스코어: 정밀도와 재현율가 얼마나 균형 잡혀 있는가? 6. ROC AUC: 이진분류에서 많이 활용하는 성적 지표 1~4: foxtrotin.tistory.com/403 5~6: foxtrotin.tistory.com/440 실습: 현재글 www.kaggle.com/uciml/pima-indians-diabetes-database Pima Indians Diabetes Database Predict the onset of diabetes based on diagnostic measures www.kaggle.com 캐글의 피마 인디언 당뇨병을 예측하는 평가..
분류 성능 평가 지표 1. 정확도(Accuracy) 2. 오차행렬(Confusion Matrix) 3. 정밀도(Precision) 4. 재현율(Recall) 5. F1 스코어: 정밀도와 재현율가 얼마나 균형 잡혀 있는가? 6. ROC AUC: 이진분류에서 많이 활용하는 성적 지표 1~4: foxtrotin.tistory.com/403 5~6: 현재글 실습: foxtrotin.tistory.com/441 5. F1 스코어 정밀도와 재현율의 맹점 정밀도를 100%으로 만드는 법: 확실한 기준이 되는 경우만 Positive로 예측, 나머지는 모두 Negative로 예측한다(누가봐도 암인 너무 정확한 사람만 암이라고 진단) 좀 더 풀어서 말하면 정밀도=TP/(TP+FP)이다. 전체 환자 1000명 중 확실한 P..
분류 성능 평가 지표 1. 정확도(Accuracy) 2. 오차행렬(Confusion Matrix) 3. 정밀도(Precision) 4. 재현율(Recall) 5. F1 스코어: 정밀도와 재현율가 얼마나 균형 잡혀 있는가? 6. ROC AUC: 이진분류에서 많이 활용하는 성적 지표 1~4: 현재글 5~6: foxtrotin.tistory.com/440 실습: foxtrotin.tistory.com/441 1. 정확도 $$정확도(Accuracy)=\frac{예측 결과가 동일한 데이터 건수}{전체 예측 데이터 건수}$$ -직관적으로 모델 예측 선응을 나타내는 평가 지표 -이진 분류의 경우 데이터 구성에 따라 ML 모델의 성능을 왜곡할 수 있어서 이 수치 하나만 가지고 성능 평가 하지 않는다(타이타닉 예제에서 ..
회귀 문제 연속된 값을 예측하는 문제 선형 회귀 주어진 데이터(실제 값) x로 타겟 y를 예측하는 과제 독립 변수 x와 y의 선형 관계를 모델링한다 1) 단순 선형 회귀 $y=Wx+b$ 독립 변수 x가 1개면 단순 선형 회귀라고 하며, 위의 식을 따른다 $W$는 가중치, $b$를 편향(bias)라고 한다 (직선 방정식이라면 기울기와 절편을 말한다) 2) 다중 선형 회귀 $y=W_1x_1+W_2x_2+...+W_nx_n+b$ $y$는 1개지만, $x$가 여러 개인 선형 회귀이다. 고려해야 하는 실제 값이 여러 개일 때 사용한다 가설 세우기((Linear) Hypothesis) 데이터로부터 x와 y의 관계를 유추하고 어떤 결과를 예측하기 위한 수학적인 식이 필요하고, 그 식을 가설이라고 한다 선형 회귀의 가..
RPN Feature맵을 인풋으로 받아서 오브젝트가 있을만한 영역을 추천한다(selective search와 비슷한 기능) 원본 이미지->VGG->RPN[Feature Map(사이즈 변경, 채널 512)->(영역추천1)1x1 Fully Convolutional Layer(이진 분류: 오브젝트인가FG/아닌가BG. 두 번 하므로 Anchor Box 9개x2) ->(영역추천2)1x1 Fully Convolutional Layer(Bounding Box Regression: X1, Y1, X2, Y2. 네 번 하므로 9x4)] Positive Anchor Box, Negative Anchor box분류 Classification Ground Truth 바운딩 박스(실제 오브젝트)가 겹치는 IOU값에 따라 Anc..
Fast RCNN -SPP Layer를 ROI Pooling Layer로 SPP-Net과 비슷하지만 L0,L1,L2로 나누지 않고 7x7크기 하나의 레이어를 가지고 벡터가 만들어짐 -End-to-End Network Learning을 시켰다(ROI Proposal은 제외) Multi-task loss함수로 Classification과 Regression을 함께 최적화 문제점: End-to-End Learning에 ROI Proposal이 되지 않았고, 그것 때문에 네트워크에 포함시켰을 때는 시간이 오래걸렸다. 네트워크를 포함하려는 요구에 따라 해결책이 나왔고, 그것이 Faster RCNN이다 Faster RCNN Fater RCNN = RPN(Region Proposal Network)+Fast RCNN..
RCNN Region Proposal 기반의 Object Detection 모델 Object Detection -원본 이미지->Feature Extrator->Feature Map->FC Layer->Soft max Class score -Sliding Window 방식과 Region Propsal 방식(대표적인 방법: Selective search) RCNN(Regions with CNN) -Region Proposal과 CNN Detection이 섞인 방법 1. 원본 이미지에서 Selective search로 후보 추출(2천개 정도) 2. 추출된 후보 이미지를 다 동일한 사이즈라고 가정(warped region), 후보를 가지고 CNN Detection 3. 후보들 Classify RCNN 장단점 높..