检索技术核心20讲-从搜索引擎到推荐引擎,带你吃透检索

检索技术核心20讲-从搜索引擎到推荐引擎,带你吃透检索

 

检索技术已经成为互联网时代技术人必不可少的技能之一,因为其应用极其广泛。

一方面,很多平台的架构设计都有相似的检索模块,比如搜索、推荐、广告等;另一方面,用好检索技术还可以帮助我们有效提升程序的执行效率,比如,只要我们能合理地使用数据库的索引功能,那程序从数据库中检索相关数据的速度就能提升好几倍。

在这个专栏中,陈东会通过20篇文章,将他十多年打造高性能广告引擎的工作经验,以及针对各种检索业务的深入思考和理解分享出来。带你系统地学习高效的检索方案和设计思想到底有哪些,到底怎么用;并且会结合工业界中的具体业务场景,从最简单的解决方案入手,一步一步带你分析各种方案的优缺点,找到最优解。

资源目录

课前必学 (2讲)

开篇词 | 学会检索,快人一步!导读 | 三步走策略,轻松搞定检索!

基础技术篇 (8讲)

01 | 线性结构检索:从数组和链表的原理初窥检索本质

02 | 非线性结构检索:数据频繁变化的情况下,如何高效检索?

03 | 哈希检索:如何根据用户ID快速查询用户信息?

04 | 状态检索:如何快速判断一个用户是否存在?

05 | 倒排索引:如何从海量数据中查询同时带有“极”和“客”的唐诗?

测一测 | 检索算法基础,你掌握了多少?

特别加餐 | 倒排检索加速(一):工业界如何利用跳表、哈希表、位图进行加速?

特别加餐 | 倒排检索加速(二):如何对联合查询进行加速?

进阶实战篇 (13讲)

06 | 数据库检索:如何使用B+树对海量磁盘数据建立索引?

07 | NoSQL检索:为什么日志系统主要用LSM树而非B+树?

08 | 索引构建:搜索引擎如何为万亿级别网站生成索引?

09 | 索引更新:刚发布的文章就能被搜到,这是怎么做到的?

10 | 索引拆分:大规模检索系统如何使用分布式技术加速检索?

11|精准Top K检索:搜索结果是怎么进行打分排序的?

12 | 非精准Top K检索:如何给检索结果的排序过程装上“加速器”?

13 | 空间检索(上):如何用Geohash实现“查找附近的人”功能?

14 | 空间检索(下):“查找最近的加油站”和“查找附近的人”有何不同?

15 | 最近邻检索(上):如何用局部敏感哈希快速过滤相似文章?

16 | 最近邻检索(下):如何用乘积量化实现“拍照识花”功能?

特别加餐 | 高性能检索系统中的设计漫谈

测一测 | 高性能检索系统的实战知识,你掌握了多少?

系统案例篇 (4讲)

17 | 存储系统:从检索技术角度剖析LevelDB的架构设计思想

18 | 搜索引擎:输入搜索词以后,搜索引擎是怎么工作的?

19 | 广告系统:广告引擎如何做到在0.1s内返回广告信息?

20 | 推荐引擎:没有搜索词,“头条”怎么找到你感兴趣的文章?

结束语 (2讲)

结束语 | 成长和进化,技术如此,我们亦如此

结课测试 | 这些检索知识,你都掌握了吗?

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。 若排除这种情况,可在对应资源底部留言,或联络我们。

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。

如果您已经成功付款但是网站没有弹出成功提示,请联系站长提供付款信息为您处理

源码素材属于虚拟商品,具有可复制性,可传播性,一旦授予,不接受任何形式的退款、换货要求。请您在购买获取之前确认好 是您所需要的资源