본문 바로가기

Regression

KNN(K-Nearest Neighbors) 3분안에 이해해보기 K-Nearest Neighbors (KNN)은 분류(Classification)와 회귀(Regression) 문제에 사용되는 지도학습(Supervised Learning) 알고리즘 중 하나입니다. KNN은 데이터셋 내에서 가장 가까운 K개의 이웃들을 찾아 그들의 레이블을 분석하여 새로운 데이터의 레이블을 예측하는 알고리즘입니다. 1) 동작 KNN 알고리즘 동작원리는... 새로운 데이터가 주어졌을 때, 가장 가까운 K개의 데이터를 선택하고 그들의 레이블을 분석합니다. 가장 많은 레이블을 가진 데이터가 새로운 데이터의 레이블로 선택되며, 이것을 예측값이라고 합니다. 요 과정의 측정을 보통은 꽤 자주 들어보았던 유클리디안 거리(Euclidean Distance)를 활용하여 측정합니다. 2) 장단점 KNN은 .. 더보기
Logistic Regression 3분안에 이해해보기 분류(Classification) Model중 하나인 Logistic Regression에 대해서 알아보도록 하겠습니다. 어려운 수식은 다빼고 간단한 이론과 아주 간단한 Python Code로 어떻게 동작하는지 정리해 보도록 하겠습니다. 1. Logistic Regression Logistic Regression은 분류(Classification) Model입니다. 종속 변수가 이항분포를 따르고, 독립 변수와 종속변수 사이의 관계에 대해서 로그 함수를 활용하여 모델링합니다. 그러므로, 두 개의 범주 중에 하나를 예측하는 데 사용합니다.(Pass / Fail 등) 학습시키는데에 그나마 쉬우며, 이해도가 높아서 꽤 많이 사용되는 Model중 하나입니다. 2. Regression ?? 실수값을 예측, 근사치를.. 더보기