[新聞] 三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版開源授權的推理模型

看板Stock (股票)作者 (pttlushen)時間4周前 (2025/02/10 14:21), 4周前編輯推噓100(1292986)
留言244則, 183人參與, 4周前最新討論串1/1
原文標題: 三位臺灣AI專家發起DeepSeek R1改造計畫,要打造繁中版開源授權的推理模型 原文連結:https://ithome.com.tw/news/167280 發布時間:2025-02-08 記者署名:王宏仁 原文內容: OpenAI去年發表了新一代推理模型o1之後,讓眾人看到GAI開始媲美真人博士或軟體開發高手般的解題能力,掀起了新一輪的大型語言模型競賽。春節期間,以開放權重釋出的DeepSeek R1模型,大幅降低了這一波推理模型競賽的門檻,成了全球AI產業的熱門焦點,開始浮現客製化推理模型的趨勢。 臺灣也有三位AI專家,在2月7日發起了一項臺灣製造大型語言模型計畫,專案代號「自由鋼普拉」(FreedomGunpla R1),希望募資3千萬元,預計在3月底釋出第一版預覽的推理模型。 這款引起全球AI圈熱議的DeepSeek R1模型,在論文中揭露了多項媲美甚至超越OpenAI o1推理模型的能力,因為可以部署到本地端,來避免企業自己的機敏資料上傳到網路,而引起AI圈的重視,不過,R1模型簡體版用戶協議中提到自己通過三項中國AI法規的備案,也讓外界擔心這款模型生成的內容偏重於對齊中國價值。 因此,臺灣有三位不同AI領域的專家,發起了這項重新改造DeepSeek R1,來打造對齊多元價值的繁體中文版推理模型計畫「自由鋼普拉」。這三位發起人,包括了AI PM助理新創MeetAndy AI創辦人薛良斌,Taiwan LLM開發者林彥廷以及雲端遊戲軟體開發供應商Ubitus的執行長郭榮昌。 薛良斌是台灣生成式AI年會主辦人,也是知名售票平臺KKTIX和MLOps新創InfuseAI的共同創辦人,由他來負責募集這項模型改造計畫的資源。 林彥廷則是具有中文大型語言模型訓練經驗的專家,他剛結束了在Meta的實習,參與了Meta訓練Llama模型的過程。林彥廷將負責FreedomGunpla R1的模型訓練工作。而最後一位郭榮昌則擁有大規模GPU叢集管理經驗,旗下公司曾獲得Nvidia破億元投資,也擁有亞洲最大的GPU農場。郭榮昌將負責算力架構和管理。 臺灣目前也有幾款繁中版大型語言模型,主要以Meta釋出的Llama模型為基礎來客製訓練,但薛良斌認為,Llama 3模型不夠聰明,甚至用以「太笨了」來形容,他指出,如果想要打造出自主能力的AI代理,使用媲美O1等級推理能力的模型是最低標準。 這項計畫的技術重點包括了,將以DeepSeek R1為基礎來進行改造,透過重新訓練模型的方式,並以開源授權釋出模型權重,也就是採取開放權重的策略釋出,最後還會打造新的模型身份與品牌。薛良斌強調,這不只是一個技術專案,更是一項文化工程,因為這是一項多元價值觀的對齊任務。 預計分三階段來實現目標,第一階段先對齊西方價值觀,可能導致模型推理能力下滑,薛良斌評估,很高機率達成這個里程碑。第二階段再進一步讓變笨的模型變得聰明,這部分則需要投入更多資源來驗證。這項計畫的終極目標是,不論使用者用繁體中文或是英文時,這款模型的表現可以比使用簡體中文更好。 這項計畫希望募資3千萬元,將由財團法人開放文化基金會(OCF)處理募資,專款專用,透過這筆資金,希望至少可以訓練兩次模型。在時程上,初步預計2025年3月底前釋出第一版預覽模型,開始搜集早期測試者的意見回饋後快速迭代,再釋出最終的版本。 心得/評論: 有料有料 台灣軟體界的大前輩出來號召要用中文資料改進 Deepseek 這樣就對了 比起開源社群那些意識形態掛帥 Deepseek剛出來在那邊喊偷資料、繞過天安門好棒棒 台灣純軟圈大佬出來喊 那些就乖乖閉嘴了XD 可以正視 Deepseek 的實力 借力使力才是真的 開發團隊陣容也相當OK 期待成果 AI PM助理新創MeetAndy AI創辦人薛良斌 Taiwan LLM開發者林彥廷 雲端遊戲軟體開發供應商Ubitus的執行長郭榮昌(由NVIDIA投資) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.57.249 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1739168485.A.1D9.html

02/10 14:22, 4周前 , 1F
沒問題吧,開源本來就是給你自己玩
02/10 14:22, 1F

02/10 14:22, 4周前 , 2F
怎麼可以依賴中國?!我們要自立自強啊!
02/10 14:22, 2F

02/10 14:23, 4周前 , 3F
真香.jpg
02/10 14:23, 3F

02/10 14:23, 4周前 , 4F
中共同路人
02/10 14:23, 4F

02/10 14:24, 4周前 , 5F
推推 中共同路人站出來
02/10 14:24, 5F

02/10 14:24, 4周前 , 6F
有資源都可以玩啊
02/10 14:24, 6F

02/10 14:24, 4周前 , 7F
抄台灣凸面的對岸政府是不是都是台獨同路人 白O
02/10 14:24, 7F

02/10 14:24, 4周前 , 8F
圖面
02/10 14:24, 8F

02/10 14:25, 4周前 , 9F
小心等等就要被出征了
02/10 14:25, 9F

02/10 14:25, 4周前 , 10F
聽都沒聽過的AI專家
02/10 14:25, 10F

02/10 14:25, 4周前 , 11F
感覺會被出征
02/10 14:25, 11F

02/10 14:25, 4周前 , 12F
有國際知名度嗎?
02/10 14:25, 12F

02/10 14:25, 4周前 , 13F
完了要被吊路燈了
02/10 14:25, 13F

02/10 14:25, 4周前 , 14F
募資白嫖 台灣人真好騙
02/10 14:25, 14F

02/10 14:25, 4周前 , 15F
青鳥怎麼不快出征啊 用對岸的東西還敢募資(咦?)
02/10 14:25, 15F

02/10 14:26, 4周前 , 16F
所以就是用簡中會變笨的模型嘛 防偷神器XDDD
02/10 14:26, 16F

02/10 14:26, 4周前 , 17F
再套一件衣服就有3000萬
02/10 14:26, 17F

02/10 14:26, 4周前 , 18F
專家?有比鳥群懂嗎
02/10 14:26, 18F

02/10 14:26, 4周前 , 19F
難怪賴皇300億預算可以搞ai 原來是要當中共同路人
02/10 14:26, 19F

02/10 14:26, 4周前 , 20F
現在打者民主自由的標語我都會怕...
02/10 14:26, 20F

02/10 14:26, 4周前 , 21F
這三位有脆鳥跟點麵線部長懂AI嗎?
02/10 14:26, 21F

02/10 14:27, 4周前 , 22F
很好啊 開源的用爆就對了
02/10 14:27, 22F

02/10 14:27, 4周前 , 23F
數發部震怒
02/10 14:27, 23F

02/10 14:27, 4周前 , 24F
專案名稱中二到有剩
02/10 14:27, 24F

02/10 14:27, 4周前 , 25F
台灣真的要加緊腳步了。AI基礎建設硬體供應鍊在台
02/10 14:27, 25F

02/10 14:27, 4周前 , 26F
灣已經是很大的優勢,軟體方面則尚未成火候,硬體
02/10 14:27, 26F

02/10 14:27, 4周前 , 27F
還要募資 真可憐……
02/10 14:27, 27F

02/10 14:27, 4周前 , 28F
主要是企業自己拼的。政府要多重視軟體這一塊。
02/10 14:27, 28F

02/10 14:27, 4周前 , 29F
不就拿人家開源下去改,然後說是原創的,要花幾百E
02/10 14:27, 29F

02/10 14:27, 4周前 , 30F
哈哈哈 股版的反中假專家還唱衰DS那麼久
02/10 14:27, 30F

02/10 14:27, 4周前 , 31F
管他中國還北韓做的,能用最大,傻了才在政治腦
02/10 14:27, 31F

02/10 14:28, 4周前 , 32F
摳憐吶
02/10 14:28, 32F

02/10 14:28, 4周前 , 33F
別玩抄襲別人啊
02/10 14:28, 33F

02/10 14:28, 4周前 , 34F
本來就是 白癡到極點 股票多好賺還要當工讀生
02/10 14:28, 34F

02/10 14:28, 4周前 , 35F
又要花錢做垃圾了
02/10 14:28, 35F

02/10 14:28, 4周前 , 36F
剛普啦XDDDD
02/10 14:28, 36F

02/10 14:29, 4周前 , 37F
募資然後簡轉繁
02/10 14:29, 37F

02/10 14:29, 4周前 , 38F
三千萬不如無腦買台積
02/10 14:29, 38F
還有 166 則推文
還有 1 段內文
02/10 17:02, 4周前 , 205F
之前勞動部分署長因為要搞低預算,霸凌搞死一個公
02/10 17:02, 205F

02/10 17:02, 4周前 , 206F
務員....
02/10 17:02, 206F

02/10 17:03, 4周前 , 207F
改造大陸AI?是不是串共?
02/10 17:03, 207F

02/10 17:07, 4周前 , 208F
建議先用 taipei-1 跑一款出來再改
02/10 17:07, 208F

02/10 17:07, 4周前 , 209F
taipei-1 只能學術用 改完就能商用了
02/10 17:07, 209F

02/10 17:10, 4周前 , 210F
跑屁跑啊 DS就有繁體中文阿 笑死
02/10 17:10, 210F

02/10 17:18, 4周前 , 211F
宣傳比較強的中國
02/10 17:18, 211F

02/10 17:21, 4周前 , 212F
可悲
02/10 17:21, 212F

02/10 17:24, 4周前 , 213F
真香.jpg
02/10 17:24, 213F

02/10 17:33, 4周前 , 214F
又專家
02/10 17:33, 214F

02/10 17:53, 4周前 , 215F
我怕,台灣只會大外宣,拿錢不辦事的募資平台專案多
02/10 17:53, 215F

02/10 17:53, 4周前 , 216F
了是,勿忘台版黑鯊5
02/10 17:53, 216F

02/10 18:11, 4周前 , 217F
代號 大和煌嗎
02/10 18:11, 217F

02/10 18:28, 4周前 , 218F
繁中版很簡單呀,叫ds都用繁中+台灣地區慣用詞回答
02/10 18:28, 218F

02/10 18:28, 4周前 , 219F
就好,三千萬可以給我嗎?
02/10 18:28, 219F

02/10 18:48, 4周前 , 220F
中共同路人?
02/10 18:48, 220F

02/10 19:26, 4周前 , 221F
這時候會說都是套皮
02/10 19:26, 221F

02/10 19:26, 4周前 , 222F
我在AI領域那麼久,怎麼不知道這三位很專家?聽都沒
02/10 19:26, 222F

02/10 19:26, 4周前 , 223F
聽過
02/10 19:26, 223F

02/10 20:12, 4周前 , 224F
假老二哲學 卷起來
02/10 20:12, 224F

02/10 20:20, 4周前 , 225F
創世天才 ai 杜呢?跟唐牛聯手
02/10 20:20, 225F

02/10 20:31, 4周前 , 226F
這樣也想領補助? 樓下都用台羅文的
02/10 20:31, 226F

02/10 20:40, 4周前 , 227F
薛這樣說是在罵自己夥伴林之前的taiwan-LLM太爛耶
02/10 20:40, 227F

02/10 21:06, 4周前 , 228F
這陣容比那個專門接民進黨標案的夠格多了
02/10 21:06, 228F

02/10 21:08, 4周前 , 229F
創世神要氣噗噗了
02/10 21:08, 229F

02/10 21:27, 4周前 , 230F
100萬美金完成訓練,台灣軟體真是頂啊!
02/10 21:27, 230F

02/10 21:55, 4周前 , 231F
很好啊不然難道台灣軟體業要一直爛下去嗎
02/10 21:55, 231F

02/10 22:06, 4周前 , 232F
只三千萬?三千萬還需要募集 ? 我看這是募來花的吧
02/10 22:06, 232F

02/10 22:26, 4周前 , 233F
他到底是誰==fb有夠洗的 如果發起人是李宏毅幾班
02/10 22:26, 233F

02/10 22:26, 4周前 , 234F
我直接捐6位數 然後週末去幫忙腳踏車發電 李老師才
02/10 22:26, 234F

02/10 22:26, 4周前 , 235F
是台灣ai教父 我看連26 都至少看他影片的 這種的寫
02/10 22:26, 235F

02/10 22:26, 4周前 , 236F
個企劃書就要拿錢zzz
02/10 22:26, 236F

02/10 23:36, 4周前 , 237F
開發鋼彈系統?
02/10 23:36, 237F

02/10 23:58, 4周前 , 238F
所以這是要套closeai還是deepfake的皮?
02/10 23:58, 238F

02/11 00:04, 4周前 , 239F
你覺得我輸入法無法切換還是DEEPSEEK無法以繁體回復
02/11 00:04, 239F

02/11 00:04, 4周前 , 240F
02/11 00:04, 240F

02/11 01:45, 4周前 , 241F
通通都是中共同路人
02/11 01:45, 241F

02/11 02:21, 4周前 , 242F
號稱台灣最聰明的唐鳳在那?
02/11 02:21, 242F

02/11 09:55, 4周前 , 243F
這串怎麼釣到一堆柵欄
02/11 09:55, 243F

02/11 19:03, 4周前 , 244F
別出來噁心人了
02/11 19:03, 244F
文章代碼(AID): #1dgPhb7P (Stock)
文章代碼(AID): #1dgPhb7P (Stock)