목록전체 글 (26)
firstStep

3-5 정형 데이터 마이닝 📊 군집 분석 완전 정복: K-means, 계층 군집, DBSCAN 제대로 이해하기!데이터 분석에서 군집 분석은 꼭 한 번쯤은 마주치는 중요한 기법입니다. 특히 ADsP 시험에서도 비정형 데이터 분석보다는 정형 데이터를 활용한 군집화가 핵심으로 등장하죠. 그런데 말입니다. 단순히 ‘비슷한 애들끼리 묶는다’라는 개념만 알면 끝일까요? 절대 아니죠.그룹핑 방법도 다르고, 거리 계산도 다르고, 심지어 결과 시각화 방식도 천차만별이거든요. 그래서 이번 글에서는 K-means, 계층 군집(Hierarchical Clustering), DBSCAN이라는 대표적인 세 가지 군집 기법을 비교하면서 확실히 잡아볼 거예요. 각 방법이 어떤 방식으로 군집을 나누고, 어떤 데이터에 적합한지, 그리..

3-5 정형 데이터 마이닝 분류 알고리즘 완전 정복: 의사결정나무부터 앙상블까지, ADsP 준비 끝내기여러분, 혹시 분류 알고리즘이라고 들어보셨나요? 데이터 분석에서 '분류'는 마치 미로 속에서 정답을 찾아가는 나침반 같은 존재예요. 🤖 고객이 이탈할지 말지, 이메일이 스팸인지 아닌지, 사진 속에 강아지가 있는지 없는지… 이런 결정들을 내려주는 도구가 바로 분류 알고리즘이죠. 그런데 문제는, ADsP 시험에 나오는 분류 알고리즘 종류가 너무 많다는 거예요. 의사결정나무, 로지스틱 회귀, k-NN, SVM, 인공신경망, 앙상블… 이름만 들어도 머리가 아픈데, 이걸 전부 이해하고 구분까지 해야 한다니! 😵💫 그래서 이 글에서는 ADsP 자격증을 준비하는 분들을 위해 분류 알고리즘을 하나하나 아주 쉽게..

3-4 다변량·시계열 PCA·FA·MDS부터 ARIMA·ETS까지! 다변량 분석과 시계열 완전 정복데이터 분석을 조금이라도 공부해본 분들이라면 한 번쯤 들어봤을 이름들 있죠. PCA, FA, MDS... 그리고 시계열 예측의 핵심인 ARIMA와 ETS 모델까지. 🤯 하지만 문제는 "대충 어떤 건지는 아는데, 왜 쓰는지, 어떻게 쓰는지는 잘 모르겠어요"라는 분들이 정말 많다는 거예요. 특히 ADsP 시험을 준비하는 분들이라면, 이 영역에서 헷갈리면 전체 흐름을 잡기 어려워집니다.이번 포스트에서는 PCA(주성분분석), FA(요인분석), MDS(다차원 척도법)부터 시계열 예측 모델 ARIMA와 ETS까지 ADsP에서 자주 등장하는 핵심 개념들을 쏙쏙 정리해드릴게요. 물론, 이해를 도울 꼭 필요한 예제와 모의..