中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第1章 绪论(主讲:陈晓辉)

信息检索与数据挖掘 2019/2/26 1 信息检索与数据挖掘 第1章绪论
信息检索与数据挖掘 2019/2/26 1 信息检索与数据挖掘 第1章 绪论

信息检索与数据挖掘 2019/2/26 2 提纲 1.1信息检索的由来和这门课的意义 1.2信息检索的历史和发展 1.3信息检索与数据挖掘等其他学科的关系 1.4信息检索的基本概念 1.5课程要求和说明
信息检索与数据挖掘 2019/2/26 2 提纲 1.1 信息检索的由来和这门课的意义 1.2 信息检索的历史和发展 1.3 信息检索与数据挖掘等其他学科的关系 1.4 信息检索的基本概念 1.5 课程要求和说明

信息检索与数据挖掘 2019/2/26 3 提纲 1.1信息检索的由来和这门课的意义 1.1.1信息过载与大数据 1.1.2信息检索的定义 1.1.3数据挖掘的定义 1.1.4本课程的意义 1.2信息检索的历史和发展 1.3信息检索与数据挖掘等其他学科的关系 1.4信息检索的基本概念 1.5课程要求和说明
信息检索与数据挖掘 2019/2/26 3 提纲 1.1 信息检索的由来和这门课的意义 1.1.1 信息过载与大数据 1.1.2 信息检索的定义 1.1.3 数据挖掘的定义 1.1.4 本课程的意义 1.2 信息检索的历史和发展 1.3 信息检索与数据挖掘等其他学科的关系 1.4 信息检索的基本概念 1.5 课程要求和说明

信息检索与数据挖掘 2019/2/26 4 信息检索的由来 为什么需要信息检索? 什么是信息检索? 什么是数据挖掘? 数据挖掘与信息检索有什么关系?
信息检索与数据挖掘 2019/2/26 4 信息检索的由来 为什么需要信息检索? 什么是信息检索? 什么是数据挖掘? 数据挖掘与信息检索有什么关系?

信息检索与数据挖掘 2019/2/26 5 1.1.1信息过载与大数据 2016互联网趋势报告:全球互联网用户数超30亿 2008年至2015年全球互联网用户数量 3,500 35% 3,000 30% 2,500 25% siasn jauJajul leqo1s 2,000 20% 1,500 15% 三 1,000 10% 500 5% 0 0% 2008 2009 2010 2011 2012 2013 2014 2015 Global Internet Users -YIY Growth (%
信息检索与数据挖掘 2019/2/26 5 1.1.1 信息过载与大数据 2016互联网趋势报告:全球互联网用户数超30亿

信息检索与数据挖掘 2019/2/26 6 1.1.1信息过载与大数据 ·数据爆炸性的增长,而人的处理能力有限 全球范围内平均每100人中的互联网用户数量 80 78* 76 70 Developed world 67 60 World globally 59 61 ◆Developing world 54 50 46 40 42 V40 38 38 36 30 24 20 721V23 17 21 10 12 3 0 1996 1998 2000 2002 2004 2006 2008 2010 2012 2014 *Estimate
信息检索与数据挖掘 2019/2/26 6 1.1.1 信息过载与大数据 全球范围内平均每100人中的互联网用户数量 • 数据爆炸性的增长,而人的处理能力有限

信息检索与数据挖掘 2019/2/26 7 1.1.1信息过载与大数据 •数据爆炸性的增长,而人的处理能力有限 2015年12月至2016年12月中国互联网基础资源对比 2015年12月 2016年12月 年增长量 年增长率 Pv4(个) 336,519,680 338,102,784 1,583,104 0.5% IPv6(块/32) 20,594 21,188 594 2.9% 域名(个) 31,020,514 42,275,702 11,255,188 36.3% 其中.CN域名(个) 16,363,594 20,608,428 4,244,834 25.9% 网站(个) 4,229,293 4,823,918 594,625 14.1% 其中.CN下网站(个) 2,130,791 2,587,365 456,574 21.4% 国际出口带宽(Mbps) 5,392,116 6,640,291 2,521,628 23.1%
信息检索与数据挖掘 2019/2/26 7 2015年12月至2016年12月中国互联网基础资源对比 1.1.1 信息过载与大数据 • 数据爆炸性的增长,而人的处理能力有限

信息检索与数据挖掘 2019/2/26 8 1.1.1信息过载与大数据 ·数据爆炸性的增长,而人的处理能力有限 万个 中国网站数量 600 482 500 423 400 320 335 300 268 230 191 200 100 2010.12 2011.12 2012.12 2013.12 2014.12 2015.12 2016.12 来源:GNC中国互联网络发展状况统计调查 2016.12 图3中国网站数量 注:数据中不包含EDU.CN下网站
信息检索与数据挖掘 2019/2/26 8 1.1.1 信息过载与大数据 • 数据爆炸性的增长,而人的处理能力有限

信息检索与数据挖掘 2019/2/26 9 1.1.1信息过载与大数据 ·数据爆炸性的增长,而人的处理能力有限 中国网页数 亿个 CNNIC CNNIC 2360 2400 2123 CNIC 1899 1600 1500 1227 866 800 600 336 161 2008.122009.122010.122011.122012.122013.122014.122015.122016.12 来源:CIC中国互联网络发展状况统计调查 2016.12
信息检索与数据挖掘 2019/2/26 9 1.1.1 信息过载与大数据 • 数据爆炸性的增长,而人的处理能力有限

信息检索与数据挖掘 2019/2/26 10 1.1.1信息过载与大数据 •数据爆炸性的增长,而人的处理能力有限 ·视频 1小时 YouTube.上每秒上传视频的小时数 35万 YouTube平均每天上传视频的用户数量 超过10亿 YouTube用户数量
信息检索与数据挖掘 2019/2/26 10 1.1.1 信息过载与大数据 • 数据爆炸性的增长,而人的处理能力有限 • 视频 1小时 YouTube上每秒上传视频的小时数 35万 YouTube平均每天上传视频的用户数量 超过10亿 YouTube用户数量
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)SSD Single Shot MultiBox Detector.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)QuickScorer a Fast Algorithm to Rank Documents with Additive Ensembles of Regression Trees.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)Neural Ordinary Differential Equations.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)Memory - Augmented Monte Carlo Tree Search.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)FOTS - Fast oriented Text Spotting with a Unified Network.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)BitFunnel Revisiting Signatures for Search.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)Beliefs and Biases in Web Search.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(研讨汇报)Accelerating Innovation Through Analogy Mining.pdf
- 厦门大学:《智能语音技术》课程教学资源(PPT课件讲稿)第2章 语音信号基础(洪青阳).pdf
- 大连民族大学(大连民族学院):《工程管理信息系统》课程教学资源(PPT课件讲稿)第二章 工程管理信息系统的开发.ppt
- 《现代音响与调音技术》课程教学资源(PPT课件讲稿)第2章 传声器.ppt
- 华中农业大学:《信息检索与利用》课程教学资源(PPT课件讲稿)第一章 信息资源与信息素养概述(主讲:宛章齐).ppt
- 房地产投资决策信息系统的开发(PPT课件讲稿).ppt
- 国家科技基础条件资源调查管理信息系统(PPT讲稿)系统操作培训.ppt
- 西安电子科技大学:《信息管理学》课程教学资源(PPT课件讲稿)第1章 绪论(主讲:赵捧未).ppt
- 海南大学:《管理信息系统》课程教学资源(PPT课件讲稿)第六章 管理信息系统的系统设计.ppt
- 海南大学:《管理信息系统》课程教学资源(PPT课件讲稿)第三章 管理信息系统的技术基础.ppt
- 北京大学:传统图书馆数字图书馆复合图书馆及其发展(PPT讲稿,信息管理系:刘兹恒).ppt
- 上海海事大学:《Management Information System》课程PPT教学课件(英文)Chapter 1 Business Information Systems in Your Career.ppt
- 北京师范大学:《管理信息系统》课程PPT教学课件(教育方向)第2讲 管理信息系统的技术基础.ppsx
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第2章 布尔检索和倒排索引.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第3章 词项词典和倒排记录表.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第4章 索引构建与索引压缩 4.1 索引构建.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第4章 索引构建与索引压缩 4.2 索引压缩.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第5章 向量模型及检索系统 5.1 向量模型.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第5章 向量模型及检索系统 5.2 检索系统.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第6章 检索的评价.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第7章 相关反馈和查询扩展.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第8章 概率模型.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第9章 基于语言建模的检索模型.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)课程要求(论文阅读&研讨).pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)矩阵分解在信息检索中的应用.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第10章 文本分类(文本分类及朴素贝叶斯方法).pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第10章 文本分类(基于向量空间的文本分类).pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第10章 文本分类(支持向量机及机器学习方法).pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)概率图及主题模型 Probabilistic Graphical Models Topic Model.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第11章 文本聚类.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)图像分类的算法思想.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)数据挖掘经典算法概述.pdf
- 中国科学技术大学:《信息检索与数据挖掘》课程教学资源(课件讲稿)第12章 Web搜索.pdf