Re: 請教一些面試問題
※ 引述《LINC.bbs@ptt3.cc (Go cubs!)》之銘言:
: ※ 引述《michaelz (michaelz)》之銘言:
: : 用開頭字母的話大概會看到一堆http, www之類的東西..然後所有的東西都要放在同一個
: : partition, 用整個url算hash code可能會好一點
: 不知道有沒有人想過用tree
: 以www.upenn.edu, www.cis.upenn.edu, www.ese.upenn.edu來說
: 看起來應該會像這樣:
: edu - upenn - www
: - cis - www
: - ese - www
: 考慮到DNS的distribution, root node 如com, edu, org應該可省下不少空間
除了上述方式,再加上 Bloom filter 應該就可以省更多空間、時間了。
http://en.wikipedia.org/wiki/Bloom_filter
<Bloom filter>
A space-efficient probabilistic data structure that is used to
test whether an element is a member of a set.
False positives are possible, but false negatives are not.
--
http://blog.sunflier.com
科技新知、爆笑圖文、理財心得
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 125.231.192.219
討論串 (同標題文章)
Oversea_Job 近期熱門文章
PTT職涯區 即時熱門文章
69
194