본문 바로가기

classification

(2)
[코세라 강의 정리] 앤드류 응의 머신러닝 - Classification, Logistic Regression 1. Classification 예측하고자 하는 값이 이산형 값(0 또는 1)인 경우 분류 문제로 보는데, 예를 들면 스팸 메일인지 아닌지, 악성 종양인지 아닌지 등을 파악하는 문제가 있다. 일반적으로 "Positive" : 1, "Negative" : 0으로 놓는다. 예를 들면, 다음과 같다. "메일이 스팸 메일이다." : 1, "일반적인 메일이다." : 0 "악성 종양이다." : 1, "악성 종양이 아니다." : 0. 분류 문제는 [0, 1]만 분류하는 게 아니라 [0, 1, 2, 3, ...n]처럼 다수의 class를 분류할 수도 있는데, 우선은 이진 분류에 대해 알아보자. 다음과 같은 악성종양을 분류를 위한 데이터가 있다고 하자. 분류를 위해서 지금까지 배운 Linear Regression을 적용..
[코세라 강의 정리] 앤드류 응의 머신러닝 - Supervised / Unsupervised Learning 프로젝트와 모의 면접을 보고 나서 개념적인 부분을 다시 한번 정리할 필요성을 느꼈다. 코세라(Coursera)에 있는 앤드류 응 교수님의 머신 러닝 강의는 무료인 데다 퀄리티가 매우 좋아서 다들 추천하는 강의인데, 여기저기 흩어진 개념을 정리하고자 수강하기로 결정했다. 이 강의는 코세라에서도 들을 수 있고 유튜브에서도 들을 수 있는데, 나는 코세라에서 들었다. 그 이유는 중간중간에 이해를 잘하고 있는지 퀴즈가 나온다. 또, 한 챕터가 끝나면 Review 코너에서 퀴즈를 풀어볼 수 있는데 80% 이상 맞아야 통과가 된다. 이런 시스템들로 내가 잘 이해하고 있는지 점검할 수 있었기 때문이다. (유튜브는 어떻게 되는지 모르겠다.) 코세라 강의 링크 : https://www.coursera.org/learn/m..