기계학습 6

Decision Tree (1/41) -> (41/41)

Decision Tree (앞으로 DT라 말하겠다.) 는 SVM 에 비해 고안된지 오래되었고 매우 강건한 (Robust) 방법이다. 그리고 DT 또한 SVM 의 kernel trick 과 같은 방법으로 비선형(non-linear)을 선형(linear)으로 나타내어 분류할 수 있다. 자, 알아들을 수 없는 소리는 여기까지하고 쉬운 예들로 DT 에 대해 설명하겠다. DT Windsurf 을 살펴보자.철수가 윈드서핑을 한다고 하자. 윈드서핑을 할 때는 바람도 많이불고 햇빛도 많이 비춰야한다. (그렇다고 태풍에 열사병이 걸릴 정도는 아니다.) 이 경우 빨간색 원은 윈드서핑을 할 수 없는 날씨, 녹색 삼각형은 윈드서핑을 할 수 있는 날씨이다. 이러한 경우 윈드서핑 가능여부를 선으로 나눌 수 있나? (Linearl..

엔트로피 (Entropy)

엔트로피를 처음 접한 것은 열역학에서이다. 하지만 이번에 소개할 엔트로피는 에서의 엔트로피이다. 엔트로피는 주어진 정보에서 내가 그 정보를 모두 다 아는데 소모되는 데이터의 양이다. (정보의 불확실성이라 표현하는 것도 적절하다.) 동전을 던지는 예로 생각해 보자. 을 살펴보자. Entropy_Coin 은 앞뒤가 같은 색이고 는 앞은 검은색, 뒤는 빨간색이다. 의 경우 색을 알아보기 위해 동전을 살펴볼 필요가 없다. (Entropy = 0) 의 경우 색을 알아보기 위해 앞과 뒤를 보아야 한다. (Entropy = 1) (이 경우 앞만 보면 되지 않냐고 할 수 있는데 엔트로피의 정의대로 하면 두쪽을 다 보는 값과 같다.) 엔트로피의 식은 아래와 같다.$Entropy(H) = \sum_{i}-P_i\log_{..

SVM (Support Vector Machine) (1/38) -> (38/38)

좀 늦었네요. 이번 글에서는 SVM (Support Vector Machine) 에 대해 소개할 것이다. (러시아 사람에 의해 고안되었다. 이름은 못찾겠는데 시간나면 찾아서 업데이트 하겠다.) SVM 은 지도학습을 통한 분류 (Supervised Classification) 이다. 앞서 소개한 Naive Bayes 와 다른 점은 Hyper dimension 을 사용한다는 것이다. 그림들을 이용하여 선형 (Linear) SVM 의 특징에 대한 소개를 하겠다. (비선형도 존재한다.) SVM Classification 에서 SVM을 이용하여 과 을 구분 (Classify) 한다면 어떤 선으로 구분할까? 답은 (아마도) 이다. SVM Margin 그렇다면 에서 SVM 을 이용하여 분류한다면 어느 선으로 분류될까..

Naive Bayes (22/43) -> (43/43)

이번 강의에서는 Bayes Rule 부터 시작해서 Naive Bayes 까지를 다룬다. Bayes Rule 은 Thomas Bayes 에 의해 고안되었다. 처음 이 법칙은 신이 있음을 증명하기 위해 만들어졌는데 이후 통계뿐 아니라 많은 분야에서 사용되고 있다. Bayes Rule 은 $P(A|B) = \frac{P(B|A)*P(A)}{P(B)}$ 이다.(여기서 $P(A|B)$ 는 조건부 확률이라 하며 B 가 일어났다고 할 때 A 가 일어날 확률이다. 예를 들어 A 가 암에 걸릴 확률이고 B 가 남자일 확률이면 $P(A|B)$ 는 남자인 사람 중에 암에 걸릴 확률을 뜻한다.)Bayes Rule 의 경우 $P(A|B)$ 와 $P(B|A)$ 중 직관적 혹은 쉽게 구할 수 없는 것을 다른 것을 통해서 쉽게 구할..

Welcome to Machine Learning -> Naive Bayes (22/43)

이번 글에서는 기계학습 (Machine Learning) 이 무엇인가 부터 시작해서 간단한 분류 (Classification) 까지를 다룬다. 이 강의를 수강하기 위해서는 파이썬 (Python), 통계에 대한 지식이 필요하다. Acerous 가 무엇일까? (What is acerous?) 에 여러 동물이 있다. 에는 동물들을 와 로 나누어 보았다.여기서 은 Acerous 인가? Not acerous 인가? (이 문제에서는 우리가 Acerous 의 뜻을 모른다 가정하고 진행한다.) 코끼리, 코뿔소, 고양이, 개, 말 (분류 X)(https://namu.wiki/) 코끼리, 코뿔소, 고양이, 개, 말 (분류 O) (https://namu.wiki/) 를 살펴보면 고양이와 개는 , 코뿔소와 코끼리는 이다. 이..

소개

이 카테고리의 글은 Udacity 의 Intro to ML (Machine Learning) 의 강의를 정리한 것이다.강의는 Stanford University 의 Sebastian Thrun 교수와 Civis 의 Data Scientist 인 Katie Malone 가 진행한다. 편의를 위해 라는 말을 생략하겠다. 약 2주 동안 이 강좌를 수강할 예정이며 모든 글의 제목은 수강한 강의 목차로 하겠다.# 수정 - 2주안에 하려했으나 일이 겹쳐서 좀 더 걸릴 것 같습니다. (170411) (거의 모방이지만 출처를 밝혔기에 문제 없으리라 본다.)