목록머신러닝/머신러닝 (42)
안 쓰던 블로그
Selective Search 실습 및 시각화 AlpacaDB/selectivesearch github.com/AlpacaDB/selectivesearch AlpacaDB/selectivesearch Selective Search Implementation for Python. Contribute to AlpacaDB/selectivesearch development by creating an account on GitHub. github.com !pip install selectivesearch 이것을 설치한다 import selectivesearch import cv2 import matplotlib.pyplot as plt import os %matplotlib inline default_dir =..
Object Detection Object(s)의 분류 뿐만 아니라 위치를 찾아내는 것 -Localization: 단 하나의 Object 위치를 Bounding box로 지정하여 찾음 -Object Detection: 여러 개의 Object들에 대한 위치를 Bonding box로 지정하여 찾음 -Segmentation: Detection보다 더 발전된 형태로 Pixel 레벨 Detection 수행 Localization과 Detection은 Object 위치를 Bounding box로 찾고(1), 판별(2)한다 (1)찾고: Bounding box regression(box의 좌표값을 예측) (2)판별: Classification 두 문제가 합쳐져 있다 주요 구성 요소 -영역 추정(Region Propos..
구글 클라우드 플랫폼의 무료 크래딧이 없어졌으므로 머신러닝 실습은 코랩으로 하려고 하는데, 옛날 글들을 보면 [구글 드라이브->폴더 생성->폴더에 colab 연결] 과정을 거쳐서 설치했다 그런데 2021.1월 기준으로 colab을 검색해도 뜨지 않는다 그래서 엄청 찾았는데.. 검색해도 나오지 않는 이유는 모르겠지만 아래 같은 방법으로 해결했다 일단 아래 링크에 접속한다 https://colab.research.google.com/ Google Colaboratory colab.research.google.com new notebook을 만든다 아래 코드를 적고 실행한다 from google.colab import drive drive.mount('/content/gdrive', force_remount=..
www.kaggle.com/c/titanic Titanic: Machine Learning from Disaster Start here! Predict survival on the Titanic and get familiar with ML basics www.kaggle.com 캐글에서 머신러닝 입문자에게 제공하는 타이타닉 데이터 세트로 타이타닉 생존자 ML 예측을 구현한다 불러오기 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic_df = pd.read_csv('./titanic_train.csv') titanic_df.head(3) Pas..
용어 정리 피처 Feature : 데이터 세트의 일반 속성 레이블, 클래스, 타겟(값), 결정(값) : 데이터의 학습을 위해 주어지는 정답 데이터. 분류의 경우 레이블 또는 클래스로 지칭 지도학습 - 분류(Classification): 명확한 정답이 주어진 데이터를 먼저 학습한 뒤 미지의 정답을 예측한다 붓꽃 데이터 분류하기 사용 라이브러리: 사이킷런(sklearn) 주어지는 붓꽃 데이터 피처(Feature) : 꽃잎의 길이와 너비, 꽃바침의 길이와 너비 결과로 도출하는 붓꽃 데이터 품종(레이블) : Setosa, Vesicolor, Virginica 예측 프로세스 데이터 세트 분리: 데이터를 학습 데이터와 테스트 데이터(미지 데이터)로 분리 모델 학습: 학습 데이터 기반으로 ML 알고리즘 적용하여 모델..
DataFrame은 drop()으로 삭제한다 DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False, errors='raise') 1. axis: DataFrame의 로우(가로)를 삭제할 때 axis=0, 컬럼(세로)를 삭제할 때는 axis=1로 설정 디폴트는 0이라서 보통 컬럼을 삭제하는 경우가 많은데 로우를 삭제해 버릴 수 있다 2. 원본 DataFrame은 유지하고 드롭된 DataFrame을 새롭게 객체 변수로 받고 싶다면 inplace=False로 설정(디폴트 값이 False) titanic_drop_df = titanic_df.drop('Age_0', axis=1, inplace=False) 예..
A=60, B=87, C=72, D=96, E=84 라는 값을 정렬하고자 한다 정보를 두 개의 array에 이렇게 담았다 두 array는 지금 암묵적으로 연결되어 있는 상태이다 score를 기준으로 정렬을 했을 때 name도 같이 정려되게 하려면 어떻게 해야 할까? Numpy의 argsort()를 이용하면 쉽게 할 수 있다 argsort()는 원본 행렬 정렬 시 정렬된 행렬의 원래 인덱스를 필요로 할 때 사용한다 이것을 이용하면 정렬 행렬의 원본 행렬 인덱스를 ndarray 형으로 반환해 준다 예를 들어보자 원본 행렬 인덱스가 0 1 2 3 원본 행렬 A가 3, 1, 9, 5 일 때 정렬 행렬은 1, 3, 5, 9 정렬된 행렬의 원본 행렬 인덱스는 1, 0, 3, 2 이다 argsort()는 1, 0, ..