본문 바로가기

판별분석3

[기계학습] 이차 판별 분석 | Quadratic Discriminat Analysis [ 이전 글 ] LDA에서는 결정경계를 선형으로 가정하고 있어 서로 다른 공분산 분류에 어려움이 있는데( 비선형 분류가 가능하긴 함 ) 이것은 QDA로 해결할 수 있다. QDA Quadratic Discriminat Analysis ] - 서로 다른 공분산 데이터 분류 가능 ( 비선형 분류 가능 ) - 서로 다른 공분산 데이터 분류를 위해 샘플이 많이 필요하다. - 독립변수(설명변수)의 개수가 많을 경우, 추정해야하는 모수가 많아짐 ➡️ 연산량이 큼 🔎 모수 아래의 식에서 β에 해당하는 것을 모수라고 함 QDA 예시 평균이 각각 (0,0) (1,1) (-1,1) 이고 class2 와 class3 의 공분산 구조는 같지만 class1의 구조가 다르기 때문에 QDA를 사용한다 [ 파이썬에서 ' IRIS 데이.. 2020. 10. 15.
[기계학습] 선형 판별 분석 | Linear Discriminant Analysis [ 지난 글 ] 에서 판별 분석에 대해서 다뤄봤는데, 이번에는 판별 분석 중에 선형 판별 분석에 대해 정리해보자 선형 판별 분석 [ Linear Discriminant Analysis ] - 데이터를 특정 한 축에 사영(projection)한 후에 두 범주를 잘 구분할 수 있는 직선을 찾는 것이 목표 위의 경우 왼쪽보다 오른쪽이 더 분류가 잘 됐다고 판단 가정 ( Assumptions ) - 아래의 가정을 만족해야 이 모델을 사용할 수 있다. 1️⃣ 각 클래스 집단은 정규분포 ( normal distribution ) 형태의 확률분포를 가짐 2️⃣ 각 클래스 집단은 비슷한 형태의 공분산 ( covariance ) 구조를 가짐 ➡️ 각 클래스 집단 모두가 아래의 3가지 형태중 한가지 형태를 띄워야 함 🧩 .. 2020. 10. 14.
[기계학습] 판별 분석 | Discriminant analysis 🔍 판별 분석이란 ? - 두 개 이상의 모 집단(= 집단 전체)에서 추출된 표본(=관찰한 결과, 집단의 성질을 추축할 수 있는 통계자료)들이 지니고 있는 정보(= 분포)를 이용하여 이 표본들이 어느 모 집단에서 추출된 것인지를 결정해 줄 수 있는 기준을 찾는 분석법 ex) 은행에서 부동산 담보 대출을 행하고자 할 경우 채무자가 대출금을 갚을 것인가? 그렇지 않을 것인가? 를 알고 싶을 때, 과거에 대출금을 반환하지 않은 사람의 정보 유형(연령, 소득, 직업, 결혼 유무)을 참고하여 신청자의 정보 유형을 과거의 유형과 비교하여 파악하는 것 📌 과거에 대출금을 반환하지 않은 사람 - 표본 📌 과거에 대출금을 반환하지 않은 사람의 정보 유형 - 판별 변수 📌 대출을 승인받은 그룹 A, 대출을 승인받지 못한 그.. 2020. 10. 13.