Solr是当下最流行的开源搜索技术解决方案,也是一个独立的企业级全文搜索应用服务器,支持按照关键字配置进行搜索,可对外提供API接口,数据分析工作中主要可以应用Solr引擎进行互联网数据、外部数据的搜索等工作,例如可以使用Solr进行信息搜索等。
本培训将对Solr数据处理工具原理及实现进行详解,循序渐进地介绍Solr是什么、Solr能做什么,以及如何更好地使用Solr进行搜索引擎开发。
本培训分级讲解,在Solr的搜索基础层,介绍Solr背后的信息检索基本概念,讲解构建一个搜索引擎所需的核心模块:索引构建、文本分析、执行搜索及处理搜索结果。在搜索功能层,介绍Solr的增强型搜索功能:分面搜索、查询建议、搜索结果分组等。最后,讲解搜索引擎的相关度,并进行实战。
第1讲 搜索引擎与Solr
1 为什么需要搜索引擎
2 Solr的基本概念
3 Solr的优势
4 Solr功能概述
第2讲 Solr的基础理论
1 搜索、匹配与找寻内容
2 相关度
3 查准率与查全率
4 搜索的规模化
第3讲 创建索引
1 微博搜索应用示例
2 设计自己的Schema
3 在schema.xml中定义字段
4 结构化非文本字段类型
5 发送文档到Solr进行索引
第4讲 文本分析
1 微博文本分析
2 基础文本分析
3 为微博文本自定义一个字段类型
4 高级文本分析
第5讲 执行查询和处理搜索结果.
1 Solr请求详解
2 查询解析器的使用
3 查询和过滤器
4 Lucene和eDisMax查询解析器
5 搜索结果排序
6 调试查询结果
第6讲 分面搜索
1 搜索结果概览
2 建立测试数据
3 字段分面和查询分面
4 区间分面和基于分面值的过滤
5 多选分面、键与标记
第7讲 查询建议
1 拼写检查
2 自动建议查询词
3 文档字段值建议
4 基于用户活动提供查询建议
第8讲 结果分组和字段折叠
1 结果分组 vs 字段折叠
2 忽略重复文档
3 搜索结果中每组返回多个文档
4 按照函数和查询对结果分组
5 对分组结果进行分页和排序
第9讲 Solr的分布式处理
1 SolrCloud核心概念
2 分布式索引
3 分布式搜索
4 集合API
5 基本系统管理任务
第10讲 多语种搜索
1 为什么语种分析很重要
2 词干提取vs.词形还原
3 处理边界情况
4 Solr支持的语种库.
5 在多语种中搜索内容
第11讲 复杂查询操作
1 函数查询
2 地理空间搜索
3 分面透视
4 引用外部数据
5 跨文档和跨索引的连接
6 使用Solr做大数据分析
第12讲 精通相关度
1 相关度调整的影响
2 相关度计算的调试
3 提升相关度
4 个性化搜索与推荐
5 塑造个性化搜索体验
现金、支票、汇款、刷卡
名 称:北京市海淀区中科院计算所职业技能培训学校
开户行:北京银行中关村支行
帐 号:01090302900120105445661