본문 바로가기

CODING/AI & ML & DL18

[AI] XAI(explainable AI)란? ℹ️ XAI ? eXplainable AI의 줄임말로 설명가능한 AI란 뜻을 가지고 있음 기존 알고리즘은 정확도와 설명력이 trade-off 관계를 가지고 있음. 기존에는 정확도가 높더라도 왜 그런 결과가 나오게 되었는지 설명할 수 없었음. (이 것을 black-box 모델이라고 함) 이러한 단점을 개선하기 위해 나온 것이 XAI → 결국 XAI 란 사람이 AI의 동작과 결과를 이해하고 올바르게 해석할 수 있고, 결과물이 생성되는 과정을 설명 가능하도록하는 기술을 의미 ❓XAI 모델의 필요성 1. 설명이 가능하다면 어디를 개선해야하는지 개선 point를 찾을 수 있음 2. 왜 그런 결과가 나왔는지 이야기할 수 있음 1. 사람이 결과를 이해할 수 있는 투명성을 개선 2. 신뢰성을 제고 여.. 2022. 8. 2.
Precision과 Recall의 차이 및 예시 Precision과 Recall 차이 이 두 가지의 차이를 아는 것이 중요한 이유는 내가 예측하는 모델을 만들 때 어디에 더 집중을 해서 모델링을 할 것인가에 중요한 지표가 되기 때문이다. 두 개가 집중하는 포인트가 다른데 그 부분은 아래에서 예시와 함께 설명하도록 하겠다. 우선 이 두 가지의 차이를 알기 위해서는 아래와 같은 Confusion Matrix를 봐야한다. 이 표를 보면 4가지의 class가 존재한다. Precision은 예측한 값들이 실제랑 얼마나 같냐를 의미한다. 말로 설명하는 것보다 예를 들어보도록 하겠다. 🔻 elephant의 precision를 구하는 방법 elephant라고 예측한 데이터의 개수 ➡️ (25 + 3 + 2 + 1) = 31개 이 중 진짜 elephant인 수 ➡️ .. 2022. 5. 22.
[MacOs / Error] xcrun: error: invalid active developer path 해결법 맥북에서 konlpy의 mecab을 사용하기 위해 코드를 쳤는데 configure: error: C compiler cannot create executables 이런 식의 에러가 나와서 'gcc -v'를 쳐봤더니 xcrun: error: invalid active developer path (/Library/Developer/CommandLineTools), missing xcrun at: /Library/Developer/CommandLineTools/usr/bin/xcrun 오잌,,! [ 해결방법 ]은 터미널에 아래 코드 작성하고 설치하기 xcode-select --install 그리고 나서 다시 mecab 깔았더니 성공 2022. 2. 13.
[Python/sklearn] Scaler 별 특징 / 사용법 / 차이 / 예시 Scaler 각 종류에 대해서 알아보기 이 전에 Scaler를 사용하는 이유에 대해 먼저 알아보자면 데이터가 가진 크기과 편차가 다르기 때문에 한 피처의 특징을 너무 많이 반영하거나 패턴을 찾아내는데 문제가 발생하기 때문 Scikit-learn에서 제공하는 여러 개의 Scaler중에 4가지를 알아볼 것이다. 1. Standard Scaler ⚫ 기존 변수의 범위를 정규 분포로 변환하는 것. ⚫ 데이터의 최소 최대를 모를 때 사용 ⚫ 모든 피처의 평균을 0, 분산을 1로 만듬 ⚫ 이상치가 있다면 평균과 표준편차에 영향을 미치기 때문에 데이터의 확산이 달라지게 됨 ➡️ 이상치가 많다면 사용하지 않는 것이 좋음 from sklearn.preprocessing import StandardScaler std = .. 2021. 10. 7.
[Python/데이터분석] 상관계수 해석 상관계수란? 어떤 변수가 증가할 때 다른 변수가 함께 증가하는지, 감소하는지 파악하는 것을 말함. 데이터에서 상관관계를 조사하는 것은 중요한 역할을 하기도 하지만 대부분의 데이터에서 두 변수를 조사했을 때 두 변수가 전혀 관계가 없는 경우보다 작게라도 상관관계가 나타나는 경우가 흔하다. 예시) 남자아이들이 지능과 바지 길이 사이에 높은 상관관계가 있지만 딱 보기에도 전혀 관계가 없다는 것을 알 수 있다. 보통 상관계수는 피어슨 상관계수(두 개의 연속 변수), 스피어만 상관계수(서열 척도 간의 관계),, 등등이 있다. 상관계수는 -1 2021. 9. 5.
[NLP] python / Keras를 사용한 챗봇 만들기 최근에 챗봇에 관심 생길만한 일이 있어서 공부할 겸 처음으로 keras 사용,, pytorch보다 훨씬 편한 건 기분 탓일까 코드 및 출처는 HERE Library version (문서 기준) 더보기 tensorflow==2.3.1 nltk==3.5 colorama==0.4.3 numpy==1.18.5 scikit_learn==0.23.2 Flask==1.1.2 참고로 나는 colab을 사용했고 약간의 버전 차이는 있지만 별 차이 없는 것 같고 colorama만 없어서 중간에 install 해주었다. !pip install colorama 일단 json 파일에 모델 학습을 위한 데이터가 저장되어 있었다. ✔️ tag : y ✔️ patterns : x 형태는 위와 같이 되어 있다. 이 딕셔너리 데이터를 .. 2021. 6. 6.