Re: [討論] 大家會擔心 ai 寫 code 讓工程師飯碗不
※ 引述《angus850503 (安格斯)》之銘言:
: 不過之前就一直對生成式 AI 有個疑問
: 就是"幻覺"到底有沒有根本上的解決方法?
目前還沒人能證明「有」,也還沒人能證明「沒有」。
有興趣的話可以追蹤這個「 LLM 幻覺排行榜」:
* https://github.com/vectara/hallucination-leaderboard/
* HN 相關討論: https://news.ycombinator.com/item?id=38286761
有興趣可以翻翻這排行榜的 Git 歷史,看看各 LLM 的進化歷程。然而,這排行
榜的評鑑方式也是公開的,各 LLM 也有可能 (不自覺地) 針對這類評鑑方式去優
化,所以這些資料只能做為參考。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 136.61.16.51 (美國)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1730513653.A.0A9.html
→
11/02 10:23,
2周前
, 1F
11/02 10:23, 1F
推
11/02 19:21,
2周前
, 2F
11/02 19:21, 2F
推
11/03 01:42,
2周前
, 3F
11/03 01:42, 3F
→
11/03 01:42,
2周前
, 4F
11/03 01:42, 4F
推
11/03 01:46,
2周前
, 5F
11/03 01:46, 5F
→
11/03 01:49,
2周前
, 6F
11/03 01:49, 6F
*感覺上* pattern recognition/matching 的低垂水果已經摘得差不多了;就看資
本/信仰能不能撐到下一個突破口,例如:
Detecting hallucinations in large language models using semantic entropy
https://news.ycombinator.com/item?id=40769496
※ 編輯: AmosYang (136.61.16.51 美國), 11/03/2024 04:44:24
推
11/03 13:30,
2周前
, 7F
11/03 13:30, 7F
→
11/03 15:41,
2周前
, 8F
11/03 15:41, 8F
→
11/03 15:41,
2周前
, 9F
11/03 15:41, 9F
→
11/03 15:41,
2周前
, 10F
11/03 15:41, 10F
→
11/03 15:41,
2周前
, 11F
11/03 15:41, 11F
→
11/03 15:41,
2周前
, 12F
11/03 15:41, 12F
→
11/03 15:41,
2周前
, 13F
11/03 15:41, 13F
→
11/03 15:44,
2周前
, 14F
11/03 15:44, 14F
→
11/03 15:44,
2周前
, 15F
11/03 15:44, 15F
→
11/03 15:44,
2周前
, 16F
11/03 15:44, 16F
推
11/03 16:33,
2周前
, 17F
11/03 16:33, 17F
推
11/04 14:22,
2周前
, 18F
11/04 14:22, 18F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 6 之 8 篇):
Soft_Job 近期熱門文章
PTT職涯區 即時熱門文章