复旦大学:《商务智能》课程PPT教学课件(商务数据分析)序列模式挖掘算法

第4章序列模式挖掘算法 2021/8/25
2021/8/25 1 第4章 序列模式挖掘算法

主要内容 序列模式挖掘简介 序列模式挖掘的应用背景 序列模式挖掘算法概述 ■GSP算法 PrefiX Span算法 Disc-a算法 ■支持约束的序列模式挖掘 2021/8/25
2021/8/25 2 主要内容 ◼ 序列模式挖掘简介 ◼ 序列模式挖掘的应用背景 ◼ 序列模式挖掘算法概述 ◼ GSP算法 ◼ PrefixSpan算法 ◼ Disc-all算法 ◼ 支持约束的序列模式挖掘

序列模式挖掘简介 序列模式的概念最早是由 Agrawal和 Srikant提出 的。 ■动机:大型连锁超市的交易数据有一系列的用户事 务数据库,每一条记录包括用户的ID,事务发生的 时间和事务涉及的项目。如果能在其中挖掘涉及事 务间关联关系的模式,即用户几次购买行为间的联 系,可以采取更有针对性的营销措施。 2021/8/25
2021/8/25 3 一、序列模式挖掘简介 ◼ 序列模式的概念最早是由Agrawal和Srikant 提出 的。 ◼ 动机:大型连锁超市的交易数据有一系列的用户事 务数据库,每一条记录包括用户的ID,事务发生的 时间和事务涉及的项目。如果能在其中挖掘涉及事 务间关联关系的模式,即用户几次购买行为间的联 系,可以采取更有针对性的营销措施

事务数据库实例 例:一个事务数据库,一个事务代表一笔交易,一个 单项代表交易的商品,单项属性中的数字记录的是商 品ID Customer Id I Transaction Time T Items Bought June 25 93 June 30 93 90 June 10 93 10,20 June 15 93 30 June 20 93 40,60,70 3 June 25 93 30.50 June 25 93 30 June 30 93 40,70 Jul25"93 90 5 June 12 93 90 2021/8/25
2021/8/25 4 事务数据库实例 ◼ 例:一个事务数据库,一个事务代表一笔交易,一个 单项代表交易的商品,单项属性中的数字记录的是商 品ID

序列数据库 一般为了方便处理,需要把数据库转化为序列 数据库。方法是把用户ID相同的记录合并,有 时每个事务的发生时间可以忽略,仅保持事务 间的偏序关系 C'ustomer Id Customer Sequence ((30)(90) 2345 (1020)(30)(406070) (305070) ((30)(4070)(90)) ((90) 2021/8/25 5
2021/8/25 5 序列数据库 ◼ 一般为了方便处理,需要把数据库转化为序列 数据库。方法是把用户ID相同的记录合并,有 时每个事务的发生时间可以忽略,仅保持事务 间的偏序关系

问题定义 项集 teaset)是所有在序列数据库出现过的单 项组成的集合 例:对一个用户购买记录的序列数据库来说, 项集包含用户购买的所有商品,一种商品就是 一个单项。通常每个单项有一个唯一的I,在 数据库中记录的是单项的ID 2021/8/25 6
2021/8/25 6 问题定义 ◼ 项集(Itemset)是所有在序列数据库出现过的单 项组成的集合 ◼ 例:对一个用户购买记录的序列数据库来说, 项集包含用户购买的所有商品,一种商品就是 一个单项。通常每个单项有一个唯一的ID,在 数据库中记录的是单项的ID

问题定义 元素( Element)可表示为x1x2xn),x(1<=k <=m)为不同的单项。元素内的单项不考虑顺 序关系,一般默认按照D的字典序排列 在用户事务数据库里,一个事务就是一个元素。 2021/8/25
2021/8/25 7 问题定义 ▪ 元素(Element)可表示为(x1x2…xm), xk (1 <= k <= m)为不同的单项。元素内的单项不考虑顺 序关系,一般默认按照ID的字典序排列. ▪ 在用户事务数据库里,一个事务就是一个元素

问题定义 序列 Sequence)是不同元素 Element)的有序排 列,序列s可以表示为s=<>,s(1<=j <=1)为序列s的元素 一个序列包含的所有单项的个数称为序列的长 度。长度为-序列记为l序列 2021/8/25
2021/8/25 8 问题定义 ▪ 序列(Sequence)是不同元素(Element)的有序排 列,序列s可以表示为s = ,sj (1 <= j <= l)为序列s的元素 ▪ 一个序列包含的所有单项的个数称为序列的长 度。长度为l的序列记为l-序列

例:一条序列有3个元 素,分别是(1020),30,(406070) 3个事务的发生时间是由前到后。这条 序列是一个6-序列 2021/8/25
2021/8/25 9 ◼ 例:一条序列有3个元 素,分别是(10 20),30,(40 60 70 ); ◼ 3个事务的发生时间是由前到后。这条 序列是一个6-序列

问题定义 设序列=,序列β=<bb 和b都是元素。如果存在整数1<=j<j2<.<jn m,使得a1sba2sb2,…, anc bin,则 称序列为序列β的子序列,又称序列β包含序 列a,记为a≤β 2021/8/25
2021/8/25 10 问题定义 ▪ 设序列 = ,序列 = ,ai 和bi都是元素。如果存在整数1 <= j1 < j2 <…< jn <= m,使得a1 bj1,a2 bj2,…, an bjn,则 称序列为序列的子序列,又称序列包含序 列,记为
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)密度聚类——算法详解.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)关联规则 CARMA Continuous Association Rule Mining Algorithm.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)09 搜索引擎优化 Search Engine Optimization.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)08 知识管理.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)07 Web挖掘基础.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)06 数据挖掘应用.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)05 数据挖掘技术方法.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)04 数据挖掘基础(数据挖掘原理).ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)03 在线分析处理 Online Analytical Processing.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)02 数据仓库 Data Warehouse.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)11 大数据分析与应用 Big data analytics and applications.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)10 流程智能 Process Intelligence.ppt
- 复旦大学:《商务智能》课程PPT教学课件(商务数据分析)01 商务智能概论 Introduction to Business Intelligence.ppt
- 《商务智能》课程学习资料:集成学习实用机器学习方法 Ensemble Learning.pdf
- 复旦大学:《商务智能》课程教学讲义(商务数据分析)电子推荐系统.pdf
- 复旦大学《商务智能》课程参考资料:室内位置服务与商业智能.pdf
- 《计算机教育Computer Education》:数据分析类课程的技能培养方法探讨(复旦大学:赵卫东,蒲实).pdf
- 《计算机教育Computer Education》:基于项目实践的机器学习课程改革(复旦大学:赵卫东,袁雪茹).pdf
- 复旦大学:《商务智能》课程学习资料(商务数据分析)一个课程内容专题(主题)的详细教学设计与实施方案.pdf
- 复旦大学:《商务智能》课程学习资料(商务数据分析)数据分析类课程案例实验实训教学交流.pdf
- 中国科学院计算技术研究所:《高级人工智能》PPT课件_贝叶斯网络——概率推理(史忠植).ppt
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第10章 基于逻辑回归模型的高危.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第11章 卷积神经网络在音频质量评价领域的应用.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第1章 数据分析过程的主要问题.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第2章 保险产品推荐.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第3章 可视化的分析.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第4章 SPSS Modeler介绍.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第5章 香水销售分析.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第6章 银行信用卡欺诈与拖欠行为分析.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第7章 海底捞火锅运营分析.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第8章 商务宾馆竞争分析.pptx
- 复旦大学:《数据挖掘实用案例分析》课程教学资源(PPT课件讲稿)第9章 耐热导线工厂质量管理数据分析.pptx
- 《商务智能:数据分析的管理视角 Business Intelligence, Analytics, and Data Science:A Managerial Perspective》教学资源(PPT课件,第3版)Chapter 01 An Overview of Business Intelligence, Analytics, and Decision Support.pptx
- 《商务智能:数据分析的管理视角 Business Intelligence, Analytics, and Data Science:A Managerial Perspective》教学资源(PPT课件,第3版)Chapter 02 Data Warehousing.pptx
- 《商务智能:数据分析的管理视角 Business Intelligence, Analytics, and Data Science:A Managerial Perspective》教学资源(PPT课件,第3版)Chapter 03 Business Reporting, Visual Analytics, and Business Performance Management.pptx
- 《商务智能:数据分析的管理视角 Business Intelligence, Analytics, and Data Science:A Managerial Perspective》教学资源(PPT课件,第3版)Chapter 04 Data Mining.pptx
- 《商务智能:数据分析的管理视角 Business Intelligence, Analytics, and Data Science:A Managerial Perspective》教学资源(PPT课件,第3版)Chapter 05 Text and Web Analytics.pptx
- 《商务智能:数据分析的管理视角 Business Intelligence, Analytics, and Data Science:A Managerial Perspective》教学资源(PPT课件,第3版)Chapter 06 Big Data and Analytics.pptx
- 《商务智能:数据分析的管理视角 Business Intelligence, Analytics, and Data Science:A Managerial Perspective》教学资源(PPT课件,第3版)Chapter 07 Business Analytics:Emerging Trends and Future Impacts.pptx
- 《商务智能:数据分析的管理视角 Business Intelligence, Analytics, and Data Science:A Managerial Perspective》教学资源(PPT课件,原书第4版)03 Descriptive Analytics II:Business Intelligence and Data Warehousing.pptx