西安电子科技大学:《信息检索》课程教学资源(课件讲稿)课程回顾与复习(主讲:徐悦甡)

本科:Web信息搜索 §7Web搜索引擎 课程总结与复习 (Course Review) 徐悦牲Yueshen Xu) ysxu@xidian.edu.cn xuyueshen@163.com 知识与数据工程研究中心 历些毛子代技七 XIDIAN UNIVERSITY
§7 Web搜索引擎 课程总结与复习 (Course Review) 徐悦甡(Yueshen Xu) ysxu@xidian.edu.cn / xuyueshen@163.com 知识与数据工程研究中心 本科:Web信息搜索

本节提纲 历些毛子科枚大多 XIDIAN UNIVERSITY 口课程总结与复习 ■Web信息搜索概述 GFS MapReduce BigTable ■全文检索+网页排序 多媒体检索 复习、重述 ■ 文本聚类 重要知识点 ■文本分类 ■推荐系统 ■语义网 知识图谱 2017/16/9 软件工程系
2017/6/9 软件工程系 本节提纲 课程总结与复习 Web信息搜索概述 GFS + MapReduce + BigTable 全文检索 + 网页排序 多媒体检索 文本聚类 文本分类 推荐系统 语义网 知识图谱 复习、重述 重要知识点

整体课程安排 历些毛子种枝大等 XIDIAN UNIVERSITY >信息检索引擎 K Google 名sK回 查询 YAHOO! Sougou嗣 Query 中国雅虎 为了用户 Ba怂百度 /数据 Sog9u搜狗 索引 聚类 ⑤0S0搜提 倒排 分类 ⑤中搜 有道y9udao 查询 推荐 爬虫 相似性 分布式 语义网 知识图谱 为了系统 建模 智能 排垿(Modeling) 2017/6/9 Ranking 软件工程系
2017/6/9 软件工程系 整体课程安排 查询 (Query) 建模 (Modeling) 排序 (Ranking) 信息检索引擎 为了用户 /数据 为了系统 /智能 索引 倒排 查询 爬虫 分布式 … 聚类 分类 推荐 相似性 语义网 知识图谱

信息检索概述 历些毛子种枚大》 XIDIAN UNIVERSITY Document corpus Query IR String System 1.Docl 2.Doc2 Ranked 3.Doc3 Documents 信息检索!=搜索引擎!=Web检索 一部分信息检索不需要涉及Web访问 201716/9 软件工程系
2017/6/9 软件工程系 信息检索概述 4 信息检索 != 搜索引擎 != Web检索 一部分信息检索不需要涉及Web访问

搜索引擎 历些毛子种枝大等 XIDIAN UNIVERSITY Web spider Search Indexer The Web 2017/6/9 软件工程系
2017/6/9 软件工程系 搜索引擎 5

术语总结 历些毛子代枚大多 XIDIAN UNIVERSITY 口Web搜索 V(World Wide Web)为典型代表的网络上检索、过滤和推荐信 息的的方法与技术 口检索 ■由用户提出查询请求,系统根据此查询请求对所存储信息进行查询 并给出查询结果 口过滤(聚类分类) ■系统根据预先设定的条件,对与该条件相符的信息进行提取、隔离 或封堵 口推荐 ■ 系统将用户需要的重要信息从大量的一般信息中提取出来,并主动 推荐给用户 2017/16/9 6 软件工程系
2017/6/9 软件工程系 术语总结 Web搜索 WWW(World Wide Web)为典型代表的网络上检索、过滤和推荐信 息的的方法与技术 检索 由用户提出查询请求,系统根据此查询请求对所存储信息进行查询 并给出查询结果 过滤(聚类/分类) 系统根据预先设定的条件,对与该条件相符的信息进行提取、隔离 或封堵 推荐 系统将用户需要的重要信息从大量的一般信息中提取出来,并主动 推荐给用户 6

工具课 历些毛子代枝大等 XIDIAN UNIVERSITY 口网络文件系统 ▣分布式文件系统 ▣MapReduce ▣HDFS ▣Lucene 2017/6/9 软件工程系
2017/6/9 软件工程系 工具课 网络文件系统 分布式文件系统 MapReduce HDFS Lucene 7

网络文件系统 历些毛子科枚大》 XIDIAN UNIVERSITY 文件服 磁盘上存 务器 客户 储有共享 的文件系 统 请求 2017/16/9 软件工程系
2017/6/9 软件工程系 网络文件系统 8

分布式文件系统 历些毛子种枝大等 XIDIAN UNIVERSITY ImDFS Storage group 1 client up2 ←二 2017/6/9 软件工程系
2017/6/9 软件工程系 分布式文件系统 9

分布式计算平台 历忠子代枚大号 XIDIAN UNIVERSITY →MapReduce sort splito map merge reduce parto sort splito map merge sort reduce part1 splito map Map Reduce 201716/9 何 软件工程系
2017/6/9 软件工程系 分布式计算平台 MapReduce 10 split0 map sort reduce part0 merge split0 map sort split0 map sort reduce part1 merge Map Reduce
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)语义网(Semantic Web).pdf
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)文本聚类(Text Clustering).pdf
- 西安电子科技大学:《构件与中间件技术》课程教学资源(课件讲稿)第二部分 Java EE与EJB 2.2 Java Web工程.pdf
- 西安电子科技大学:《构件与中间件技术》课程教学资源(课件讲稿)第一部分 软件构件与中间件(主讲:徐悦甡).pdf
- 西安电子科技大学:计算机软件开发模式和工具与标准发展历程(主讲:徐悦甡).pdf
- 上海海洋大学:信息学院各专业课程教学大纲(汇编).pdf
- 南京农业大学:《数据库系统原理》课程教学大纲.pdf
- 南京农业大学:《数据结构实验》课程教学大纲.pdf
- 南京农业大学:《数据库系统原理实验》课程教学大纲.pdf
- 南京农业大学:《面向对象程序设计实验》课程教学大纲.pdf
- 南京农业大学:《软件工程》课程教学大纲.pdf
- 南京农业大学:《Web 应用系统开发》课程教学大纲.pdf
- 《人工智能》课程教学资源(参考资料)基于Jupyter Notebook的Tensorflow深度学习教程.pdf
- 中国人民大学:《人工智能》课程教学资源(作业摘选)SCIgen生成文献的检测方案.pdf
- 中国人民大学:《人工智能》课程教学资源(作业摘选)人工智能课程总结.pdf
- 私立华联学院:《Android软件开发》课程电子教案(课件讲稿)第十章 后台默默的劳动者——探究服务.pdf
- 私立华联学院:《Android软件开发》课程电子教案(课件讲稿)第九章 看看精彩的世界——使用网络技术.pdf
- 私立华联学院:《Android软件开发》课程电子教案(课件讲稿)第八章 丰富你的程序——运用手机多媒体.pdf
- 私立华联学院:《Android软件开发》课程电子教案(课件讲稿)第七章 跨程序共享数据——探究内容提供器.pdf
- 私立华联学院:《Android软件开发》课程电子教案(课件讲稿)第六章 数据存储全方案——详解持久化技术.pdf
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)文本分类(Text Classification).pdf
- 西安电子科技大学:《信息检索》课程教学资源(课件讲稿)推荐系统(Recommender System).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)课程概述 Parallel Computing(主讲:徐悦甡).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行计算机系统结构模型(第一部分,含第一次作业).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行计算机系统结构(第二部分).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行计算机性能测评.pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行程序设计基础与样例(第一部分).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)并行程序设计基础与样例(第二部分,交互问题与计算圆周率).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)Java并发程序设计(并行程序设计基础与样例).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)Java并发与并行程序设计.pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)Python并发与并行程序设计(语言基础部分).pdf
- 西安电子科技大学:《并行计算》课程教学资源(课件讲稿)Python并发编程部分(Python并发程序设计).pdf
- 西安电子科技大学:《数据通信与计算机网络》课程教学资源(PPT课件)HDLC帧结构——高级数据链路控制协议(帧结构).pptx
- 西安电子科技大学:《数据通信与计算机网络》课程教学资源(PPT课件)数字数据通信技术——异步与同步传输.pptx
- 西安电子科技大学:《信息检索》课程教学资源(讲义)文本挖掘中的概率图模型、矩阵方法与变量求解.pdf
- 《机器学习》课程教学资源(讲稿)Academic Paper Writing for Starters.pdf
- 《机器学习》课程教学资源(讲稿)The Structure of an Academic Paper in CS(for Starters).pdf
- 《机器学习》课程教学资源(讲稿)推荐系统入门——任务、特征与方法概述(Recommender System).pdf
- 《机器学习》课程教学资源(讲稿)自然语言理解、主题建模与基于NN的语言生成 Natural Language Processing, Topic Modeling and Neural Text Generation.pdf
- 《机器学习》课程教学资源(讲稿)基于上下文的服务推荐 Context-Aware Service Recommendation.pdf