[請益] 資料歸納

看板ask-why (知識奧秘)作者 ( )時間15年前 (2010/06/03 02:35), 編輯推噓33(352405)
留言442則, 10人參與, 最新討論串1/3 (看更多)
我有將近 10萬筆的資料 可是是不同類型的 有文章 有圖片 有影片 小到連網址都有 .. 可是我不太會收納 不知道有沒有什麼好的收納方式可以供參考呢 ? 有人專門在研究電子資料收納的嗎 ? thx -- 嗨嗨每個人 我的專長:迅速解毒 當機處理 資料救援 取回帳號 系統規劃 資訊整合 系統規劃:經濟,高效能,低污染,節約能源,(降低噪音震動,電磁波,廢熱,積塵,輻射) 省空間,使用舒適感佳,溫暖的鍵盤與滑鼠 (抗手冰冷) 鄉民說收卡是為了培養EQ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 219.70.217.172

06/03 03:36, , 1F
有啊,資工系。
06/03 03:36, 1F

06/03 04:02, , 2F
所以你是要問為什麼要收納嗎XD
06/03 04:02, 2F

06/03 10:28, , 3F
即使是完全同類型且可排序的資料好了(檔名為數字),如何
06/03 10:28, 3F

06/03 10:29, , 4F
快速存取仍然有學問。同事曾經教過我,根據檔案系統的特性
06/03 10:29, 4F

06/03 10:30, , 5F
當一個子目錄裏檔案過多時,OS搜尋檔案的速度會變慢(可
06/03 10:30, 5F

06/03 10:30, , 6F
排序會讓人想到寫二分搜尋法,可惜那是OS的工作,你寫了
06/03 10:30, 6F

06/03 10:31, , 7F
也無法叫OS聽話),所以甚至要限制一個子目錄裏檔案數量
06/03 10:31, 7F

06/03 10:31, , 8F
而將整個檔案系統以多子目錄來呈現。(這時你再寫二分搜尋
06/03 10:31, 8F

06/03 10:32, , 9F
倒是有機會派上用場了;你可以二分搜尋自己的檔案在哪個子
06/03 10:32, 9F

06/03 10:34, , 10F
目錄),研究這些可以加快網頁的存取速度。
06/03 10:34, 10F

06/03 16:22, , 11F
現在沒有軟體能夠分辨資料的內容吧. 例如分辨同是花朵的圖片
06/03 16:22, 11F

06/03 16:24, , 12F
那頂多只能由資料外顯的資訊做分類,例如靠名稱、大小、種類
06/03 16:24, 12F

06/03 16:27, , 13F
但如果你有能力把10萬個資料都看一遍, 那你可以設定你喜好的
06/03 16:27, 13F

06/03 16:29, , 14F
分類. 例如: 常不常用、性質(遊戲、音影、作業、軟體等)
06/03 16:29, 14F

06/03 16:33, , 15F
作者(或演唱者、開發公司). 有必要還可以以檔案名稱分
06/03 16:33, 15F

06/03 16:34, , 16F
最後細節的部分可以注上年份、或版本. 但一切前提是知道內容
06/03 16:34, 16F

06/03 16:37, , 17F
像我自己過去幾年曾重新安裝過幾次電腦. 舊的資料我就按我得
06/03 16:37, 17F

06/03 16:39, , 18F
到它們的年份丟在一起. 這樣做雖然沒什麼效率,但只要我還大
06/03 16:39, 18F

06/03 16:40, , 19F
概記得我那年收過哪些資料, 就可以找....到(?)
06/03 16:40, 19F

06/03 20:32, , 20F
這種東西要延用50年 ...
06/03 20:32, 20F

06/03 20:35, , 21F
所以我沒說錯啊,你要一篇post講完,教授會說題目太大
06/03 20:35, 21F

06/03 20:36, , 22F
你如果去修學分,就看看教授用幾堂課來講這個題目。
06/03 20:36, 22F

06/03 20:37, , 23F
我們不講圖,那還牽涉圖形辨識,我們講書,文章的分類
06/03 20:37, 23F

06/03 20:37, , 24F
這樣就有個圖書館系耶!
06/03 20:37, 24F

06/03 20:38, , 25F
我說的作法和我自己實際作法 並不是相互對應的
06/03 20:38, 25F

06/03 20:39, , 26F
目前的Web快速發展,之前網路泡沫化時倒了一堆,說實話那
06/03 20:39, 26F

06/03 20:39, , 27F
我說的作法是 個人看法+參考圖書館的作法
06/03 20:39, 27F

06/03 20:39, , 28F
些是搶商機,但未經驗證50年;但圖書管理就有50年歷史!
06/03 20:39, 28F

06/03 20:43, , 29F
我自己實際作法,是當時應急的結果
06/03 20:43, 29F

06/03 20:44, , 30F
但每個資料夾還有子目錄, 所以並沒有那麼糟(自我感覺良好)
06/03 20:44, 30F

06/03 20:46, , 31F
這個議題很重要 每個人的意見都很寶貴 ..thx
06/03 20:46, 31F

06/03 20:46, , 32F
看爸爸媽媽偶爾還是會把泛黃的照片拿出來看一看
06/03 20:46, 32F

06/03 20:47, , 33F
五十年後的我們呢 ?
06/03 20:47, 33F

06/03 20:50, , 34F
圖形辨識搜尋 google 在做了,以後就指望它吧~
06/03 20:50, 34F

06/03 20:50, , 35F
甚至連影像,聲音搜尋(唱一段找出歌名)都很多人在做了
06/03 20:50, 35F

06/03 20:51, , 36F
前公司以前是代理圖形辨識引擎的;不是程式,而是函式庫
06/03 20:51, 36F

06/03 20:52, , 37F
其實圖形辨識也做很久了。不過你得自己去呼叫寫程式出來。
06/03 20:52, 37F

06/03 21:33, , 38F
圖片搜尋早有了 http://www.tineye.com/
06/03 21:33, 38F

06/04 04:15, , 39F
自己有能耐才是真的 =.=
06/04 04:15, 39F
還有 363 則推文
還有 1 段內文
06/05 18:42, , 403F
在工具裏;好比象棋程式,是先要有好的棋藝,而不是迷戀 C++
06/05 18:42, 403F

06/05 18:43, , 404F
或人工智慧的語法.美工也一樣,先會設計;熟練工具只會變
06/05 18:43, 404F

06/05 18:44, , 405F
工具人,操作員,老闆站在你背後叫你調亮調暗,那你就不是在
06/05 18:44, 405F

06/05 18:44, , 406F
設計,你是在操作.
06/05 18:44, 406F

06/05 18:45, , 407F
因此回到資料歸納,還在沒有電腦的時代就有這個問題,昨天我
06/05 18:45, 407F

06/05 18:45, , 408F
說另一個板另一篇文章正在吵,就是因為某人把整個房間弄很
06/05 18:45, 408F

06/05 18:45, , 409F
亂又不許別人丟掉他任何一樣東西,這樣會家庭革命的!
06/05 18:45, 409F

06/05 18:46, , 410F
你在現實生活中如果不能好好的歸納,在電子工具幫忙下也是
06/05 18:46, 410F

06/05 18:46, , 411F
會亂成一團.至於格式等其實問題不大,只要保留RAW DATA,格
06/05 18:46, 411F

06/05 18:46, , 412F
式永遠不變,BMP 將會支援好幾個世紀!
06/05 18:46, 412F

06/05 18:48, , 413F
從前我在台塑採購部當工讀生,面臨電腦當機,全公司電子化採
06/05 18:48, 413F

06/05 18:48, , 414F
購停擺,但採購人員馬上重新以現實世界的紙本運作.採購的本
06/05 18:48, 414F

06/05 18:49, , 415F
質學能在對商品,價格的了解.如果有人吵老闆沒給他最快的電
06/05 18:49, 415F

06/05 18:49, , 416F
腦,那根本就不是重點.我們採購會保留舊的的交易記錄,據以
06/05 18:49, 416F

06/05 18:50, , 417F
對廠商的信用度提出評比,這件事電腦能做,沒電腦也能做
06/05 18:50, 417F

06/05 18:50, , 418F
我們有一間檔案室,裏面全是列印出來的檔案文件,就這樣馬上
06/05 18:50, 418F

06/05 18:51, , 419F
接手運作起來.但舊檔案要保留多久,二十年的要不要保留?
06/05 18:51, 419F

06/05 18:51, , 420F
資料要整理才有價值,檔案室又不是幾百坪,這是採購在整理資
06/05 18:51, 420F

06/05 18:52, , 421F
料時自己要衡量的.
06/05 18:52, 421F

06/05 19:02, , 422F
電腦當機對我們是個惡夢啦...紙本運作是會work,但早就沒有保
06/05 19:02, 422F

06/05 19:04, , 423F
留能維持紙本運作的人力與系統...
06/05 19:04, 423F

06/05 19:08, , 424F
光是'傳送文書'這件事,都沒有準備足夠的人力啊...
06/05 19:08, 424F

06/05 19:54, , 425F
沒有準備那也是評估後的結果,是先能把事情做好,再評估
06/05 19:54, 425F

06/05 19:54, , 426F
而不是一個連事情都做不好的人,評估時也只有幾個不成熟的
06/05 19:54, 426F

06/05 19:55, , 427F
方案,從爛的裏選一個.那是本來就做不好的問題.
06/05 19:55, 427F

06/05 23:00, , 428F
以本院的運作,恕我不敬,我懷疑這件事是不是真的有人評估過
06/05 23:00, 428F

06/05 23:01, , 429F
...感覺上比較像是沒有人想過會發生'當機'這件事...
06/05 23:01, 429F

06/05 23:05, , 430F
發生後才急忙把將近十年前的紙本作業流程拿出來用...說真的沒
06/05 23:05, 430F

06/05 23:06, , 431F
幾個人記得十年前到底是怎麼運作的...甚至大部分人十年前都不
06/05 23:06, 431F

06/05 23:06, , 432F
在這裡。
06/05 23:06, 432F

06/06 00:16, , 433F
所以大膽假設 這根本就是個虛構的世界 ...
06/06 00:16, 433F

06/06 00:16, , 434F
沒有人真的對這種事情認真 ..
06/06 00:16, 434F

06/06 00:16, , 435F
大家只為了工作取得利益完成自己的夢想而已
06/06 00:16, 435F

06/06 00:18, , 436F
看看nasa那些人預測五十億年以後的太陽系
06/06 00:18, 436F

06/06 00:18, , 437F
它們有夢想又有資源去完成它們的夢想...
06/06 00:18, 437F

06/06 00:19, , 438F
在台灣可能只是為了生活而工作目的不同所以理念
06/06 00:19, 438F

06/06 00:20, , 439F
是沒辦法貫徹的 ..除非有人由衷的熱愛它
06/06 00:20, 439F

06/06 00:22, , 440F
貫徹理念為什麼要別人屈就你?那比如藍綠大戰你怎麼說?
06/06 00:22, 440F

06/06 00:23, , 441F
一邊的理念是統一,一邊的理念是獨立的話,怎麼能人人滿意?
06/06 00:23, 441F

06/06 00:23, , 442F
貫徹理念,由自己努力,是很公平的事!
06/06 00:23, 442F
文章代碼(AID): #1C1gHxuj (ask-why)
討論串 (同標題文章)
以下文章回應了本文 (最舊先):
完整討論串 (本文為第 1 之 3 篇):
33
442
文章代碼(AID): #1C1gHxuj (ask-why)