PTT職涯區 / studyabroad (留學)

Re: [問題] 想走Big Data的選系困擾

看板studyabroad (留學)作者vity (逍遙盃-佛得)時間11年前 (2015/02/02 06:32)推噓6(6推 0噓 6→)

留言12則, 9人參與討論串7/11 (看更多)

前面強者都說得很有道理，在下稍微從CS的角度補充故事是這樣的 1.量太多了 Google(Amazon、Yahoo!...) 每天所收到的查詢量太多沒辦法存全部，只能存部分 (也可以是滑鼠點擊、Session) 知道每天到底有多少不同的查詢非常重要 (許多進階的分析都需要Count distinct) 於是想辦法"抽樣來代表母體" 抽樣的方法是Hash Function成010101的位元 Google在2005年就嘗試解決這樣的問題(Min-Count) 2.計算太複雜了拿迴歸來說，統計學用的是Least Square CS本來用Gradient Descent，因為資料太大改用Stochastic Gradient Descent 把演算法寫成平行運算版本(Hadoop)，交給cluster跑另外，實作時也可能會發生: 理論說，計算獨立事件一起發生的機率，相乘所有事件發生的機率實際寫程式才發現事件太多，因電腦無法表示到該小數位，相乘機率全是0 所以取Math.log之後，把相乘變成相加，電腦就能表示了講了許多CS觀點在下也沒有認為CS面對大量數據時比較先進而是統計與CS發威在價值鏈不同的地方(前面強者有分享) 呼應前面強者所提，Stanford有很好的資源它的開放課程Mining of Massive Datasets 教授許多關於資料太大，Memory不夠用的演算法 https://www.coursera.org/course/mmds Univ. of Washinton也是很好的選擇它的開放課程Data Science探討許多的實作(MapReduce, Pregel) https://www.coursera.org/course/datasci 也可以看看相關工作所要求的技能 http://www.kdnuggets.com/jobs/index.html 就選你所愛，愛你所選囉 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 79.197.209.160 ※ 文章網址: https://www.ptt.cc/bbs/studyabroad/M.1422829966.A.E01.html

→

02/02 07:28, , 1^F

02/02 07:28, 1^F

→

02/02 07:28, , 2^F

02/02 07:28, 2^F

→

02/02 07:29, , 3^F

02/02 07:29, 3^F

→

02/02 08:37, , 4^F

02/02 08:37, 4^F

推

02/02 10:41, , 5^F

02/02 10:41, 5^F

→

02/02 12:09, , 6^F

02/02 12:09, 6^F

推

02/02 13:05, , 7^F

02/02 13:05, 7^F

推

02/02 13:45, , 8^F

02/02 13:45, 8^F

→

02/02 13:46, , 9^F

02/02 13:46, 9^F

推

02/02 15:31, , 10^F

02/02 15:31, 10^F

推

02/02 15:47, , 11^F

02/02 15:47, 11^F

推

03/18 11:48, , 12^F

03/18 11:48, 12^F

‣ 返回看板[ studyabroad ] 留學

‣ 更多 vity 的文章

文章代碼(AID): #1KpgcEu1 (studyabroad)

討論串 (同標題文章)

完整討論串 (本文為第 7 之 11 篇)：

排序：最新先 | 最舊先 | 留言數

0

8

Re: [問題] 想走Big Data的選系困擾

11年前, 02/10

8

10

Re: [問題] 想走Big Data的選系困擾

11年前, 02/09

5

5

Re: [問題] 想走Big Data的選系困擾

11年前, 02/09

1

2

Re: [問題] 想走Big Data的選系困擾

11年前, 02/02

6

12

Re: [問題] 想走Big Data的選系困擾

11年前, 02/02

Re: [問題] 想走Big Data的選系困擾

11年前, 02/02

8

16

Re: [問題] 想走Big Data的選系困擾

11年前, 02/01

12

14

Re: [問題] 想走Big Data的選系困擾

11年前, 01/31

0

14

Re: [問題] 想走Big Data的選系困擾

11年前, 01/31

3

8

Re: [問題] 想走Big Data的選系困擾

11年前, 01/31

在新視窗開啟完整討論串 (共11篇)

studyabroad 近期熱門文章

1

1

[租屋] NCSU @ Raleigh 找室友

[ studyabroad ]

1周前, 05/02

4

12

[情報] 申請結果分享網站

[ studyabroad ]

1周前, 04/30

2

16

[問題] 以前申請出國留學有多難？

[ studyabroad ]

2周前, 04/22

5

8

[問題] 青少年德國遊學團

[ studyabroad ]

2周前, 04/22

2

8

[選校] 26 Fall UIUC MCS / SJSU MSSE

[ studyabroad ]

3周前, 04/16

12

37

[選校] 26 Fall CS/ECE 選校請益

[ studyabroad ]

1月前, 04/05

1

7

[選校] ASU Phd MS/Clemson MS/Stevens MS

[ studyabroad ]

1月前, 04/02

2

13

[選校] 2026 Fall 選校請益UCB/UW/UMich

[ studyabroad ]

1月前, 03/25

更多近期熱門文章 >>

PTT職涯區即時熱門文章

6

28

[閒聊] 社會是否在懲罰成家立業勤懇工作的人

36分鐘前, 05/09

19

52

Re: [請益] gdp跟股市這麼強內需怎沒成長

37分鐘前, 05/09

9

17

Re: [新聞] 英特爾股價飆升逾15%，據報與蘋果達成晶

43分鐘前, 05/09

6

49

[請益] 現在都收盤沒多久就催人補錢嗎

55分鐘前, 05/09

37

67

[標的] AMD, MU, SK Hynix市值超車台積可能性

1小時前, 05/09

54

90

[新聞] 美伊衝突將畫下句點？川普：預計今晚收到

1小時前, 05/09

53

118

Re: [請益] 重壓怎樣抱緊睡的安穩？

1小時前, 05/09

-2

12

[新聞] 配合美國制裁傳大陸要求銀行暫停5家煉油

1小時前, 05/09

更多即時熱門文章 >>

‣ 返回看板[ studyabroad ] 留學

‣ 更多 vity 的文章

文章代碼(AID): #1KpgcEu1 (studyabroad)