中国人民大学:《统计学》课程PPT教学课件(第三版)第12章 聚类分析

第12章聚类分析 121聚类分析的基本原理 122层次聚类 123K均值聚类
第 12 章 聚类分析 12.1 聚类分析的基本原理 12.2 层次聚类 12.3 K-均值聚类

1ATISTIG. 学习目标 (三 聚类分析的基本思想和原理 层次聚类和K-均值聚类的基本过程 解释聚类的结果 层次聚类和K均值聚类的差异及应用条件 聚类分析的注意事项 用SPSS进行聚类分析 2008年月
12 - 4 统计学 STATISTICS (第三版) 2008年8月 学习目标 ⚫ 聚类分析的基本思想和原理 ⚫ 层次聚类和K-均值聚类的基本过程 ⚫ 解释聚类的结果 ⚫ 层次聚类和K-均值聚类的差异及应用条件 ⚫ 聚类分析的注意事项 ⚫ 用SPSS进行聚类分析

1ATISTIG. 怎样把消费者分类? (三 南京雅兴市场研究有限公司在A城市的14个城区抽取3000个 15岁以上具有独立购买能力的消费者样本,研究消费者的生 活方式。调查中采用一系列关于对社会活动、价值观念等内容 的陈述,请消费者根据自己的情况做出评价。评价结果采用7 分评价法,1分表示“非常同意”,7分表示“非常不同意” 对调查结果先通过因子分析将一系列的测试语句进行综 根 据消费者的回答情况,将这些语句分为几大类,最后得到5个 主要因子,它们的含义分别是:对时尚的观点、个人的事业性 进取性、对经济利益的看法、社交能力与影响力、生活的计 划性。根据因子分析的结果对样本的回答按照新的类型进行重 新评估打分,然后根据这些评价进行聚类分析 根据每一类消费者的因子的特征,最终将消费者的生活方式分 为6个类别,即:时尚型、自保型、领袖型、上进型、迷茫型 (缺乏生活目标型)和平庸型 12-5 2008年月
12 - 5 统计学 STATISTICS (第三版) 2008年8月 怎样把消费者分类? ⚫ 南京雅兴市场研究有限公司在A城市的14个城区抽取3000个 15岁以上具有独立购买能力的消费者样本, 研究消费者的生 活方式。调查中采用一系列关于对社会活动、价值观念等内容 的陈述,请消费者根据自己的情况做出评价。评价结果采用7 分评价法,1分表示“非常同意” ,7分表示“非常不同意” ⚫ 对调查结果先通过因子分析将一系列的测试语句进行综合,根 据消费者的回答情况,将这些语句分为几大类,最后得到5个 主要因子,它们的含义分别是:对时尚的观点、个人的事业性 与进取性、对经济利益的看法、社交能力与影响力、生活的计 划性。根据因子分析的结果对样本的回答按照新的类型进行重 新评估打分,然后根据这些评价进行聚类分析 ⚫ 根据每一类消费者的因子的特征,最终将消费者的生活方式分 为6个类别,即:时尚型、自保型、领袖型、上进型、迷茫型 (缺乏生活目标型)和平庸型

1ATISTIG. 怎样把消费者分类? (三 时尚型:这类消费者约占样本量的约21%,主要特征为:年龄相对较 轻,平均年龄在35岁左右,教育程度相对较高,一般具有高中以上文 化程度,虽然平均家庭月收入较好,平均在2200元左右,同时也是分 散程度最高的,表明喜爱时尚并不是高收入者的专利。这一类型中的 资企业员工的比例最大,未婚的比例较大,约占114,女性的比例为 55%,高于男性 自保型:这类消费者占16%,他们更多的是为自己的生计考虑,考虑 自己能否有稳定的经济来源,维持家庭的经济保障是他们最关心的 题。这些人的平均受教育程度较低,中年人的比例较高,平均年龄在 44岁左右,家庭月收入较低,平均在1600元左右,国营企业员工以及 离退休人员的比例较高。女性的比例高于男性 领袖型:这类消费者占13%。教育程度处于社会平均水平,主要为中 年人,有较多的生活阅历,年龄多在45-54岁之间。家庭月平均收入 般在1800元左右。在职业上没有显著特征。已婚比例是各类消费者 中最高的,这似乎表明有稳定的家庭也是成为领袖的一个条件。男性 比例占55%,高于女性 2-6 2008年月
12 - 6 统计学 STATISTICS (第三版) 2008年8月 怎样把消费者分类? ⚫ 时尚型:这类消费者约占样本量的约21%,主要特征为:年龄相对较 轻,平均年龄在35岁左右,教育程度相对较高,一般具有高中以上文 化程度,虽然平均家庭月收入较好,平均在2200元左右,同时也是分 散程度最高的,表明喜爱时尚并不是高收入者的专利。这一类型中的 三资企业员工的比例最大,未婚的比例较大,约占1/4,女性的比例为 55%,高于男性 ⚫ 自保型:这类消费者占16%,他们更多的是为自己的生计考虑,考虑 自己能否有稳定的经济来源,维持家庭的经济保障是他们最关心的问 题。这些人的平均受教育程度较低,中年人的比例较高,平均年龄在 44岁左右,家庭月收入较低,平均在1600元左右,国营企业员工以及 离退休人员的比例较高。女性的比例高于男性 ⚫ 领袖型:这类消费者占13%。教育程度处于社会平均水平,主要为中 年人,有较多的生活阅历,年龄多在45-54岁之间。家庭月平均收入 一般在1800元左右。在职业上没有显著特征。已婚比例是各类消费者 中最高的,这似乎表明有稳定的家庭也是成为领袖的一个条件。男性 比例占55%,高于女性

1ATISTIG. 怎样把消费者分类? (三 上进型:占消费者总人数的不到13%。他们对生活的态度积极,多 为未婚青年,平均年龄在28岁左右,25岁以下的占40%,单身未婚 的比例占12以上。职业上的显著特征是:1/3为学生,三资企业 的比例达1/10。男性的比例高于女性。这类消费者是受教育程度最 高的,他们的平均家庭收入却是最高的,月平均收入在2300元左右 迷茫(缺乏生活目标型:约占15%,他们既不注重经济保障,也不参 培训,生活节奏较缓慢。这类消费者主要为退休人员,约占该类 型人员的2/3,剩下的主要为国营企业员工。平均年龄在50岁以上, 他们的教育程度是最低的,家庭收入也是最低的,平均不到1600元 在性别分布上,女性的比例远远高于男性,占62% 平庸型:这类消费者约占23%,最大的特点是生活没有计划,日常 生活没有规律,而其他指标则均处于中间状态。这类消费者在年龄 上比较分散,从15岁到54岁之间的各年龄段均有相当比例,平均教 育程度一般,家庭月平均收入在1900元左右。在职业上没有显著特 征,但待岗人员的比例稍高于其他各类型。在性别上,男性稍高于 女性 2-7 2008年月
12 - 7 统计学 STATISTICS (第三版) 2008年8月 怎样把消费者分类? ⚫ 上进型:占消费者总人数的不到13%。他们对生活的态度积极,多 为未婚青年,平均年龄在28岁左右,25岁以下的占40%,单身未婚 的比例占1/2以上。职业上的显著特征是:1/3为学生,三资企业员工 的比例达1/10。男性的比例高于女性。这类消费者是受教育程度最 高的,他们的平均家庭收入却是最高的,月平均收入在2300元左右 ⚫ 迷茫(缺乏生活目标)型:约占15%,他们既不注重经济保障,也不参 加培训,生活节奏较缓慢。这类消费者主要为退休人员,约占该类 型人员的2/3,剩下的主要为国营企业员工。平均年龄在50岁以上, 他们的教育程度是最低的,家庭收入也是最低的,平均不到1600元。 在性别分布上,女性的比例远远高于男性,占62% ⚫ 平庸型:这类消费者约占23%,最大的特点是生活没有计划,日常 生活没有规律,而其他指标则均处于中间状态。这类消费者在年龄 上比较分散,从15岁到54岁之间的各年龄段均有相当比例,平均教 育程度一般,家庭月平均收入在1900元左右。在职业上没有显著特 征,但待岗人员的比例稍高于其他各类型。在性别上,男性稍高于 女性

聚类分析 1ATISTIG. (三 (cluster analysis) ■在现实生活中,分类问题是十分常见的 根据经济发展水平把各个国家分成发达国家、中等发达 国家、发展中国家 按照消费者的特征对消费者分类,按照产品特征对产 分类 ■这些分类中,有的事先并不知道存在什么类别,完 全按照反映对象特征的数据把对象进行分类,这在 统计上称为聚类分析;有的则是在事先有了某种分 类标准之后,判定一个新的研究对象应该归属到哪 类别,这在统计上则称为判别分析( discriminant analysis) 本章主要介绍聚类分析方法 2008年月
12 - 8 统计学 STATISTICS (第三版) 2008年8月 ◼ 在现实生活中,分类问题是十分常见的 ⚫ 根据经济发展水平把各个国家分成发达国家、中等发达 国家、发展中国家 ⚫ 按照消费者的特征对消费者分类,按照产品特征对产品 分类 ◼ 这些分类中,有的事先并不知道存在什么类别,完 全按照反映对象特征的数据把对象进行分类,这在 统计上称为聚类分析;有的则是在事先有了某种分 类标准之后,判定一个新的研究对象应该归属到哪 一类别,这在统计上则称为判别分析(discriminant analysis) ◼ 本章主要介绍聚类分析方法 聚类分析 (cluster analysis)

第12章聚类分析 121聚类分析的基本原理 121.1什么是聚类分析? 121.2相似性的度量
12.1 聚类分析的基本原理 12.1.1 什么是聚类分析? 12.1.2 相似性的度量 第 12 章 聚类分析

12.1聚类分析的思想和原理 121.1什么是聚类分析?
12.1.1 什么是聚类分析? 12.1 聚类分析的思想和原理

什么是聚类分析? 1ATISTIG. (三 (cluster analysis) 把“对象”分成不同的类别 这些类不是事先给定的,而是直接根据数据的特 征确定的 把相似的东西放在一起,从而使得类别内部 的“差异”尽可能小,而类别之间的“差异 ”尽可能大 类分析就是按照对象之间的“相似”程度 把对象进行分类 2008年月
12 - 11 统计学 STATISTICS (第三版) 2008年8月 ◼ 把“对象”分成不同的类别 ⚫ 这些类不是事先给定的,而是直接根据数据的特 征确定的 ◼ 把相似的东西放在一起,从而使得类别内部 的“差异”尽可能小,而类别之间的“差异 ”尽可能大 ◼ 聚类分析就是按照对象之间的“相似”程度 把对象进行分类 什么是聚类分析? (cluster analysis)

什么是聚类分析? 1ATISTIG. (三 (两种分类方式) 聚类分析的“对象”可以是所观察的多个样本, 也可以是针对每个样本测得的多个变量 按照变量对所观察的样本进行分类称为Q型聚类 ●按照多项经济指标(变量)对不同的地区(样木)进行分 类 按照样本对多个变量进行分类,则称为R型聚类 °按照不同地区的样本数据对多个经济变量进行分类 ■两种聚类没有什么本质区别,实际中人们更感兴 趣的通常是根据变量对样本进行分类(Q型聚类) 2008年月
12 - 12 统计学 STATISTICS (第三版) 2008年8月 ◼ 聚类分析的“对象”可以是所观察的多个样本, 也可以是针对每个样本测得的多个变量 ◼ 按照变量对所观察的样本进行分类称为Q型聚类 ⚫ 按照多项经济指标(变量)对不同的地区(样本)进行分 类 ◼ 按照样本对多个变量进行分类,则称为R型聚类 ⚫ 按照不同地区的样本数据对多个经济变量进行分类 ◼ 两种聚类没有什么本质区别,实际中人们更感兴 趣的通常是根据变量对样本进行分类(Q型聚类) 什么是聚类分析? (两种分类方式)
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《社会统计学》课程教学资源(PPT课件讲稿)第十三章 卡方检验与方差分析.ppt
- 中国人民大学:《统计学》课程PPT教学课件(第三版)第13章 非参数检验.ppt
- 《计量经济学》课程教学资源(PPT课件讲稿)数据的来源.ppt
- 《统计学》课程教学资源(PPT课件讲稿)第五章 抽样调查.ppt
- 《应用回归分析》课程教学资源(PPT课件讲稿)第6章 多重共线性的情形及其处理.ppt
- 《统计学》课程教学资源(PPT课件讲稿)第十一章 线性相关与回归.ppt
- 《应用概率统计》课程教学资源(PPT课件讲稿)第1章 事件与概率.ppt
- 《数理统计》课程PPT教学课件(统计推断)统计量与抽样分布.pptx
- 《社会统计分析方法》课程PPT教学课件(SPSS软件应用)第五章 因子分析.ppt
- 《应用回归分析》课程教学资源(PPT课件讲稿)第7章 岭回归.ppt
- 《概率论与数理统计》课程教学资源(PPT课件讲稿)第八章 假设检验.ppt
- 《房地产金融》课程教学资源(PPT课件讲稿)第四章 个人住房贷款.ppt
- 中国人民大学:《统计学》课程PPT教学课件(第三版)第4章 概率与概率分布(作者:贾俊平).ppt
- 华中科技大学:《多元统计分析》课程教学资源(PPT课件讲稿)社会统计学导论.ppt
- 《医学统计学》课程教学资源(PPT课件)第十九章 统计表和统计图.ppt
- 《医学统计学》课程教学资源(PPT课件讲稿)方差分析、假设检验时应注意的事项.ppt
- 《统计学》课程教学资源(PPT课件讲稿)第一章 基础统计学回顾.ppt
- 《医学统计学》课程教学资源(PPT课件讲稿)第十三章 医学统计学方法的基本概念和基本步骤、常用统计分析软件简介.ppt
- 《统计学》课程教学资源(PPT课件)项目十 相关与回归分析——相关关系的测定及回归模型的建立.ppt
- 北京师范大学:《社会科学统计软件及应用》教学资源(PPT课件讲稿)第9讲 降维分析与分类分析(归因分析).ppsx
- 《统计学》课程电子教案(PPT教学课件)第十一章 指数.ppt
- 北京师范大学:《社会科学统计软件及应用》教学资源(PPT课件讲稿)第8讲 管理信息系统的实务.ppsx
- 《统计学》课程PPT教学课件(讲稿)项目五 统计基本分析指标(1)总量指标和相对指标.ppt
- 《社会统计分析方法》课程PPT教学课件(SPSS软件应用)第二章 多元线性回归 multiple linear regression.ppt
- 《概率与统计》课程教学资源(PPT课件讲稿)正态总体的参数检验.ppt
- 《医学统计学》课程教学资源(PPT课件讲稿)第十二章 医学人口和疾病统计 第一节 医学人口统计常用指标.ppt
- 《统计学》课程电子教案(PPT教学课件)第三章 数据整理.ppt
- 《统计学》课程教学资源(PPT课件讲稿)统计学电子教案(共八章).ppt
- 《统计学》课程电子教案(PPT教学课件)第十六章 统计表和统计图.pps
- 《时间序列分析》课程教学资源(PPT课件讲稿)第四章 非平稳序列的确定性分析.ppt
- 计量软件实验(PPT课件讲稿)EViews软件应用——基本回归模型.ppt
- 《医学统计学》课程教学资源(PPT课件讲稿)第九章 数值变量资料的统计分析(二).ppt
- 《统计学》课程教学资源(PPT课件讲稿)第2章 统计数据的描述.ppt
- 《统计学》课程教学资源(PPT课件讲稿)第一章 基础统计学回顾(第四节 基础概率、第五节 概率分布、第六节 参数估计).ppt
- 《社会统计分析方法》课程PPT教学课件(SPSS软件应用)第三章 通径分析(Path Analysis).ppt
- 信息论基础(PPT课件讲稿)统计自然语言处理基本概念.ppt
- 延安大学:《社会统计学 Social Statistics》课程教学资源(PPT课件讲稿)第十二章 相关与回归分析.ppt
- 中国人民大学:《统计学》课程PPT教学课件(第三版)第5章 概率与概率分布.ppt
- 云南大学发展研究院:时间序列分析(PPT课件讲稿)时间序列的季节调整、分解与平滑.ppt
- 同济大学医学院:《医学统计学》课程教学资源(PPT课件讲稿)队列研究.pptx