专栏名称: 九章算法

专业的北美IT求职经验分享、技术交流社区，帮助你找到好的IT工作。由硅谷顶尖IT企业工程师维护。提供专业的算法培训/面试咨询，官网 www.jiuzhang.com

目录

相关文章推荐

算法爱好者 · 阿里蔡崇信自曝：被 DeepSeek ... · 2 天前

算法爱好者 · 震撼！美国卡脖子下，中国工程师拖 4 ... · 昨天

算法与数据结构 · 惊艳我的 LRU ... · 4 天前

算法与数据结构 · Cursor 1.0 ... · 3 天前

算法爱好者 · 知名开源神器 Alist ... · 3 天前

51好读 › 专栏 › 九章算法

系统设计面试题 | 东邪讲解 post 系统的设计

九章算法 · 公众号 · 算法 · 2017-01-10 08:35

正文

请到「今天看啥」查看全文

{3: [b]} --> {2: [a ->c]} --> {1: [d]}

然后另外还需要一个hashmap，key是element，value是这个element在链表上的具体位置。

因为每一次的操作都是 count + 1和 count - 1，那么每次你通过 hashmap 找到对应的element在数据结构中的位置，+1的话，就是往头移动一格，-1的话，就是往尾巴移动一格。总而言之复杂度都是 O(1)。当你需要找 Top K 的时候，也是 O(k)的时间可以解决的。

这个数据结构来自 LFU 的论文：
http://dhruvbird.com/lfu.pdf
LintCode上有LFU的题，可以做一下：
www.lintcode.com/problem/lfu-cache

从系统设计的角度分析

所以一般来说，你可能首先需要按照 LFU 的思路答出上述的方法。这个就过了第一关， 算法关 。但是还没结束，这个题还有第二关，那就是 系统设计关 。上面的算法从算法的角度没办法更优了，每个分享操作都是O(1)的代价，每个求Top K都是O(k)的代价。已经很棒了。但是系统的角度出发，会存在这样一些问题：

1

如果QPS比较高，比如 1m，这个数据结构因为要加锁才能处理，所以会很慢。

2

分享的数据本身是分布式的，而不是中心化的，也就是说，比如有1000台web服务器，那么这1000台web服务器的是最先获得哪个帖子被分享的数据的，但是这些数据又都分布在这1000台web服务器中，如果用一个中心化的节点来做这个数据结构的服务，那么很显然这个中心节点会成为瓶颈。

3

比如这个系统用在twitter 这样的服务中，根据长尾理论，有80%或者更多的帖子连 Top 20% 都排不进去。而通常来说，从产品的角度，我们可能只需要知道 Top 20 最多是 Top 100 的数据就可以了。整个系统浪费了很多时间去统计那些永远不会成为Top 100的数据。

请到「今天看啥」查看全文

推荐文章

算法爱好者 · 阿里蔡崇信自曝：被 DeepSeek 逼急了，工程师春节睡办公室搞研发

2 天前

算法爱好者 · 震撼！美国卡脖子下，中国工程师拖 4 箱硬盘飞国外训练 AI。网友：这招太绝了！

昨天

算法与数据结构 · 惊艳我的 LRU 算法：程序员刷题路上的第一道“神题”

4 天前

算法与数据结构 · Cursor 1.0 太炸裂了！自动捉bug，秒改屎山代码，AI编程分水岭已至

3 天前

算法爱好者 · 知名开源神器 Alist 被卖，新东家黑历史震惊全网

3 天前

虚拟现实 · 关于2017年的VR，我们能做出哪些判断？

8 年前

画廊 · 鸟类写生的方法

8 年前

理想聚焦 · 许小年：中国历代变法为何只有商鞅和邓小平成功了

8 年前

反腐前沿 · 【学思践悟】把基础工作做深做细做实

8 年前

娱乐新天地 · 直男“最爱的女神”评选结果出炉：邱淑贞击败高圆圆夺冠

8 年前

移动版

51好读 - 微信公众号文章