[新聞] 樂天發表基於deepseek的日語AI模型

看板Stock (股票)作者 (單推人) 每日換婆 (1/1)時間1小時前 (2026/03/18 14:10), 編輯推噓17(17011)
留言28則, 21人參與, 16分鐘前最新討論串1/1
原文標題: 楽天、「GENIACプロジェクト」の一環として開発された国内最大規模の高性能AIモデル「 Rakuten AI 3.0」を提供開始 原文連結: https://corp.rakuten.co.jp/news/press/2026/0317_01.html 發布時間: 2026/03/17 記者署名: 楽天グループ株式会社 原文內容: 楽天グループ株式会社(以下「楽天」)は、経済産業省および国立研究開発法人新エネル ギー・産業技術総合開発機構(以下「NEDO」)が推進する日本の生成AIの開発力強化を目 的としたプロジェクト「GENIAC(Generative AI Accelerator Challenge)プロジェクト 」(以下「GENIAC」)の一環として開発した国内最大規模(注1)の最新AIモデル「Rakut en AI 3.0」(以下「本モデル」)を本日提供開始しました。 樂天集團股份有限公司(以下簡稱「樂天」)今日宣佈,正式推出國內最大規模(註1)的 最新 AI 模型「Rakuten AI 3.0」(以下簡稱「本模型」)。本模型是作為日本經濟產業省 及國立研究開發法人新能源・產業技術綜合開發機構(NEDO)所推動、旨在強化日本生成式 AI 開發能力的「GENIAC(Generative AI Accelerator Challenge)專案」(以下簡稱「G ENIAC」)的一環所開發。  2025年12月の発表以降、ファインチューニングして改良された本モデルは、複数の日本 語ベンチマークで優れたスコアを達成しました。楽天は、本モデルの公開により、国内の AIアプリケーションを開発する企業や技術者を支援することを目指します。なお、本モデ ルはApache 2.0ライセンス(注2)で提供され、楽天の公式リポジトリ(注3)から無償で ダウンロードすることができます。 自 2025 年 12 月發布以來,本模型經過微調(Fine-tuning)與改良,在多項日語基準測 試(Benchmark)中取得了優異的評分。樂天希望透過公開本模型,支援國內開發 AI 應用 程式的企業與技術人員。此外,本模型採用 Apache 2.0 授權,可從樂天的官方存儲庫免費 下載。 本モデルは、日本語に最適化された約7,000億パラメータのMixture of Experts(MoE)ア ーキテクチャ(注8)を採用したモデルです。オープンソースコミュニティ上の最良なモ デルを基に、楽天独自の高品質なバイリンガルデータ、技術力および研究成果によって開 発しているため、日本の独特な言語のニュアンスや文化、慣習をより深く理解することが できます。文章作成やコード生成、文書解析や抽出に至るまで、幅広い用途でのテキスト 処理に優れており、これまでに楽天で開発したモデルと比較して、特に複雑なタスクに対 する精度が大幅に向上しています。 本模型是針對日語進行優化、採用約 7,000 億參數之「專家混合(Mixture of Experts, M oE)架構」(註8)的模型。其以開源社群中最優秀的模型為基礎,結合樂天獨有的高品質 雙語數據、技術實力及研究成果開發而成,因此能更深層地理解日本獨特的語言細微差別、 文化與習俗。從文章寫作、程式碼生成到文件解析與擷取,本模型在廣泛用途的文本處理上 表現卓越,與樂天過往開發的模型相比,特別是在處理複雜任務的精確度上有大幅提升。  楽天グループのChief AI & Data Officer(CAIDO)であるティン・ツァイは次のように コメントしています。「楽天は、企業とユーザーをエンパワーメントする高品質で費用対 効果の高いLLMモデルの開発に注力しています。本モデルは競争力のあるモデルであり、 大規模なデータに加え、エンジニアリング、革新的なアーキテクチャの組み合わせを実現 しました。また、オープンモデルを共有することで、国内におけるAI開発を加速化すると ともに、経済産業省とも連携し、日本全国の人々に変革をもたらす協調的なAI開発コミュ ニティを構築することを目指します」 樂天集團首席 AI 與數據官(CAIDO)丁·蔡(Ting Cai)表示:「樂天致力於開發高品質且 具成本效益的 LLM 模型,以賦能企業與使用者。本模型是一款極具競爭力的模型,實現了 大數據、工程技術與創新架構的結合。此外,透過分享開源模型,我們旨在加速日本國內的 AI 開發,並與經濟產業省合作,構建一個能為全日本人民帶來變革的協作式 AI 開發社群 。」  なお、楽天は、次世代LLMの研究開発のため、2025年7月にGENIACの第3期公募に採択さ れました。本モデルの学習費用の一部は、生成AI開発に必要な計算資源として、「GENIAC 」の補助を受けています。楽天は現在、LLMを研究目的で開発しており、お客様に快適な サービスを提供するため、今後も様々な選択肢を評価・検討していきます。さらに、オー プンソースコミュニティへの貢献を目指し、本モデルを公開することで、AIアプリケーシ ョンやLLMのさらなる開発を後押しします。楽天は、AI化を意味する造語「AI-nization( エーアイナイゼーション)」をテーマに掲げ、さらなる成長に向けてビジネスのあらゆる 面でAIの活用を推進する取り組みをしています。今後も豊富なデータと最先端のAI技術の 活用を通じて、世界中の人々へ新たな価値創出を目指してまいります。 此外,為了研發次世代 LLM,樂天於 2025 年 7 月入選 GENIAC 第三期招募計畫。本模型 的部分學習費用獲得了「GENIAC」的補助,作為開發生成式 AI 所需的計算資源。樂天目前 正以研究為目的開發 LLM,為了提供客戶更舒適的服務,未來將持續評估與探討各種選擇。 再者,樂天旨在為開源社群做出貢獻,透過公開本模型,推動 AI 應用程式及 LLM 的進一 步發展。樂天以意指 AI 化的造語「AI-nization」為主題,致力於在業務的各個面向推動 AI 應用以實現進一步成長。未來,我們將持續透過豐富的數據與最先進的 AI 技術,致力 於為世界各地的人們創造新價值。 心得/評論: 樂天 (4755.T) 今天發表了日文大語言模型,模型網址:https://huggingface.co/Rakuten /RakutenAI-3.0 出現了兩個爭議 一是套皮模型拿了政府專案 二是刪除了deepseek原本的授權條款,違反了裡面明寫需要繼承授權的限制 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.79.60.166 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1773814226.A.E77.html

03/18 14:16, 1小時前 , 1F
$$$$$$$$$
03/18 14:16, 1F

03/18 14:17, 1小時前 , 2F
他不是賣電子書的?
03/18 14:17, 2F

03/18 14:17, 1小時前 , 3F
新聞可以改標題?
03/18 14:17, 3F

03/18 14:18, 1小時前 , 4F
模型開始玩套娃了喔
03/18 14:18, 4F

03/18 14:18, 1小時前 , 5F
哪裡有說deepseek
03/18 14:18, 5F

03/18 14:19, 1小時前 , 6F
整篇文章看了好幾次內容都沒有提到ds
03/18 14:19, 6F

03/18 14:19, 1小時前 , 7F
笑死了 那不就是DS翻譯成日文而已嗎
03/18 14:19, 7F

03/18 14:20, 1小時前 , 8F

03/18 14:21, 1小時前 , 9F
模型連結點進去就寫deepseek v3了
03/18 14:21, 9F

03/18 14:21, 1小時前 , 10F
deepseek不錯啊
03/18 14:21, 10F

03/18 14:23, 1小時前 , 11F
deepseek大獲全勝
03/18 14:23, 11F

03/18 14:24, 1小時前 , 12F
有開源給你訓練微調的大模型也就那幾個
03/18 14:24, 12F

03/18 14:28, 1小時前 , 13F
感動 柵欄崩潰
03/18 14:28, 13F

03/18 14:32, 1小時前 , 14F
DS現在有千問好用嗎?我看對岸也比較多在討論千問
03/18 14:32, 14F

03/18 14:44, 1小時前 , 15F
還不是靠中國
03/18 14:44, 15F

03/18 14:46, 1小時前 , 16F
那是因為開源吧,就圖便宜
03/18 14:46, 16F

03/18 14:54, 1小時前 , 17F
豆包更好用
03/18 14:54, 17F

03/18 14:55, 1小時前 , 18F
Deepshit也說他是GPT啊
03/18 14:55, 18F

03/18 14:56, 1小時前 , 19F
日本語LLM鼠了差不多
03/18 14:56, 19F

03/18 14:56, 1小時前 , 20F
市場上前幾位通用模型太強
03/18 14:56, 20F

03/18 14:56, 1小時前 , 21F
03/18 14:56, 21F

03/18 15:04, 1小時前 , 22F
qwen是小模型居多(0.8~397b),大部分人只裝的起這
03/18 15:04, 22F

03/18 15:04, 1小時前 , 23F
個,deepseek很大(671b),要資料中心才能跑了
03/18 15:04, 23F

03/18 15:06, 59分鐘前 , 24F
千問現在不是最爛的嗎
03/18 15:06, 24F

03/18 15:18, 47分鐘前 , 25F
禁詞多少?
03/18 15:18, 25F

03/18 15:27, 38分鐘前 , 26F
好笑的是,用DS修改還刪除註明來源於DS,被國外SI社
03/18 15:27, 26F

03/18 15:27, 38分鐘前 , 27F
群罵翻
03/18 15:27, 27F

03/18 15:49, 16分鐘前 , 28F
現在只有美中有能力自研AI
03/18 15:49, 28F
文章代碼(AID): #1fka7Ivt (Stock)
文章代碼(AID): #1fka7Ivt (Stock)