본문 바로가기

분류 전체보기35

분류 모델(Classification)의 성능지표 분류모델의 경우엔 다양한 성능지표가 존재하며 다른 수치로 평가를 해야한다. 이번시간에는 1)오차행렬 (Confusion Matrix), 2) 정확도(Accuracy), 3) 정밀도(Precision), 4) 재현율(Recall), 5) F1 Score 그리고 6) ROC-AUC 총 6개의 성능지표에 대해 알아보자. 1. 오차 행렬 (Confusion Matrix) 이진분류의 예측오류를 2x2 행렬로 보여주고 다른 유형의 예측오류를 나타내주는 지표 sklearn.metrics confusion_matrix() 2. 정확도 (Accuracy) 모델 예측 성능을 직관적으로 보여주는 지표 이진분류의 경우에는 정확도 수치로만 모델의 성능을 평가하기에는 위험이 따름 (데이터의 구성에 따른 왜곡 가능성) 특히 데이터.. 2021. 2. 18.
재고관리 (Association Rules) 들어가기전... 이 프로젝트는 회사와 학교와 학생팀으로 이루어져 기밀서약계약을 하고 진행한 관계로 자세하게 다루지는 못하지만 어떻게 진행을 했고 어떤 어려움이 있었으며 어떻게 극복했는지 그리고 전체적으로 진행하면서 배웠던 점과 아쉬운 점을 서술하기에 깊게 이해하기에 부족할 수 있을 것 같다. 프로젝트는 나를 포함한 3명의 학생들 (나, 중국계 미국인, 그리고 미국인), HyVee본사의 데이터 분석팀 2명과 학교 교수님으로 이루어져서 진행했다. 협업사(Company): Hy-Vee Hy-Vee는 미국 중서부에 위치함 슈퍼마켓 체인으로서 총 245개의 지점을 가지고 있으며 주로 아이오와, 일리노이, 캔자스, 미네소타, 미주리, 네바다, 사우스 다코타, 그리고 위스콘신에 비즈니스를 운영중이다. 신선도를 무기로.. 2021. 2. 13.
안녕하세요. 안녕하세요. 세상을 데이터로 탐구하고 싶은 늦깍이 데이터분석가입니다. 이 곳은 늦었지만 데이터를 향한 저의 관심과 세상을 탐구하고자 하는 목표를 가지고 만들어진 공간입니다. 저를 늦깍이로 표현한데에는 저의 일생을 바라보았을때 "느림"라는 단어가 떠올라서 였습니다. 그 이유를 간단히 설명하자면 재수와 유학준비 2년, 학사졸업에 4.5년, 그리고 데이터의 관심을 가지게 된 시기가 졸업학기였어서 데이터와 코딩을 본격적으로 시작한것은 2년이 안됩니다. 허나 감사하게도 흥미있는 분야라는 것이 생겨 그 이후로 고통스럽지만 즐겁고 행복하게 배움을 추구하는 사람으로서 저를 생각하면 떠오르기 때문입니다. 세상을 탐구하고자 하는 저의 기나긴 여정을 같이 공유하고 싶고 나아가 저와 비슷한 고민과 과정을 겪으신 분들과 같이 .. 2021. 1. 25.

출처: https://privatedevelopnote.tistory.com/81 [개인노트]