In [20]:
dat2=read.csv("final.csv")
head(dat2)
In [21]:
#datascale=scale(dat2) #표준화
datascale = dat2
In [22]:
kim.out=hclust(d=dist(datascale[sample(1:nrow(datascale), 20),]))
kim.out
In [23]:
plot(kim.out)
In [24]:
kim.out <- kmeans(datascale, 10)
kim.out
In [25]:
kimout1=kim.out$withinss
kimout1
In [26]:
kimout2=kim.out$betweenss
kimout2
In [27]:
library(fpc)
plotcluster(datascale, kim.out$cluster)
In [52]:
library(NbClust)
nc = NbClust(datascale, min.nc=2, max.nc=10, method="kmeans")
In [53]:
par(mfrow = c(1, 1))
barplot(table(nc$Best.n[1,]), main="Number of Clusters ")
In [30]:
library(useful)
plot.kmeans(kim.out)
In [56]:
kim.out_1 = kmeans(datascale, 6)
plotcluster(datascale, kim.out_1$cluster)
In [57]:
kim.out_1
cluster means 기반 군집의 특성 도출¶
In [ ]:
'''
1번 군집
Age Annual.Income Spending.Score Male
1 54.06000 40.46000 36.72000 0.4400000
평균연령 54, 하위권 소득, 매우 낮은 소비수준, 여성비율이 조금 높음
2번 군집
Age Annual.Income Spending.Score Male
2 25.25000 25.83333 76.91667 0.4166667
평균연령 25, 최하위권 소득, 매우 높은 소비수준, 여성비율이 높음
3번 군집
Age Annual.Income Spending.Score Male
3 32.20000 109.70000 82.00000 0.4000000
평균연령 32, 최상위권 소득, 가장 높은 소비수준, 여성비율이 높음
4번 군집
Age Annual.Income Spending.Score Male
4 41.64706 88.73529 16.76471 0.5588235
평균연령 41, 매우 높은 소득, 가장 낮은 소비수준, 남성비율 조금 높음
5번 군집
Age Annual.Income Spending.Score Male
5 33.39623 58.05660 48.77358 0.3584906
평균연령 33, 중간 수준 소득, 중간 수준 소비, 여성비율이 매우 높음
6번 군집
Age Annual.Income Spending.Score Male
6 32.86207 78.55172 82.17241 0.4827586
평균연령 32, 높은 수준 소득, 가장 높은 수준 소비, 여성비율이 조금 높음
'''
소득이 높거나 소비수준이 높은 경우 군집별 CRM 방안 논의¶
In [ ]:
'''
1번 군집
평균연령 54, 하위권 소득, 매우 낮은 소비수준, 여성비율이 조금 높음
타겟 마케팅시 손익분석 마진이 안 나오는 그룹이므로 이 군집은 CRM 대상이 아닌 것으로 보입니다.
======================================================
2번 군집
평균연령 25, 최하위권 소득, 매우 높은 소비수준, 여성비율이 높음
3번 군집
평균연령 32, 최상위권 소득, 가장 높은 소비수준, 여성비율이 높음
6번 군집
평균연령 32, 높은 수준 소득, 가장 높은 수준 소비, 여성비율이 조금 높음
2, 3, 6 그룹은 이미 높은 소비 수준을 보이고 있기 때문에 기존 전략이 효과적이라고 판단.
프로모션시 할인쿠폰보다는 신상품 또는 재입고상품 위주로 메일 발송.
======================================================
4번 군집
평균연령 41, 매우 높은 소득, 가장 낮은 소비수준, 남성비율 조금 높음
4번 그룹은 소득이 높지만 소비가 낮은 원인 분석이 필요합니다.
예) 우리 매장에 찾는 물건이 없는지 여부 등
======================================================
5번 군집
평균연령 33, 중간 수준 소득, 중간 수준 소비, 여성비율이 매우 높음
3번과 6번 군집과 유사하게 여성의 비율이 높고 연령대도 유사합니다.
연령대가 젊은 층인 2번 군집과는 차이가 있기 때문에 3번과 6번의 경우와 비교해야 합니다.
소득수준이 다르기 때문에 해당 소득분위에 적절한 물건을 확보하는 등의 전략 설정이 필요합니다.
'''
In [ ]:
In [ ]:
'[중급] 가볍게 이것저것' 카테고리의 다른 글
비트코인 알고리즘 직접 구현해보기 (0) | 2020.04.02 |
---|---|
월마트 맥주와 기저귀 썰에 대한 부분. (0) | 2020.03.25 |
고객 장바구니 분석 level_2 (0) | 2019.11.10 |
고객 장바구니 분석 level_1 (0) | 2019.11.08 |
[Turbofan] 설비 잔존수명 예측 / 예방보전 / 관리한계선 설정방법 (0) | 2019.11.06 |