跳到主要内容

博客

代码人生:编织技术与生活的博客之旅

说一个很常见的场景吧,我们在新闻网站、视频网站浏览新闻视频的时候,它们是怎么给我们推荐那些我们没看过的内容的呢? 可能你会想到:服务器端储存每个用户的观看记录,在去除掉每个用户已观看的内容,但是这种方法会给服务器端很大的压力,当用户量特别大的时候,每个人看过的内容又很多的时候,效率会大大降低,甚至拖垮服务。 如果每个用户的观看内容是存到了关系型数据库,那每次查询的时候都要顺便判断是否有重复观看的数据,说实话,关系型数据库不适合这种场景。 再假如,把观看数据存到了缓存中,但是这些数据是不会消失的,会随着时间的推移而变得越来越多,时间长了缓存也一样撑不住。 这个时候就需要专业的工具去解决这种场景,我们的布隆过滤器就可以登场了!

Redis阅读需 4 分钟

之前学习爬虫的时候,如果是 HTML 的数据,通过 xpath 或是 css 选择器,就能很快的获取我们想要的数据,如果是 json 有没有类似 xpath 这种,能够直接根据条件定位数据,而不需要自行 json 解析在遍历获取。答案是有的,也就是 JSONPath。

javascriptjsonnode阅读需 8 分钟