Re: [討論] 為何機器人AI不透過強化式學習訓練?

看板Tech_Job (科技人)作者 (雲川閒步)時間1月前 (2024/10/17 09:29), 編輯推噓6(601)
留言7則, 7人參與, 1月前最新討論串2/2 (看更多)
強化學習只有在遊戲取得成功是有原因的 因為遊戲世界本身就是一個純虛擬的環境 操控的自由度也不高 比如說圍棋就是19*19取一格落子 (19*19看起來很高 可是特斯拉的機器人光手掌就有二十幾個dof) 所以下圍棋可以一秒鐘就下幾千萬盤棋 但你如果要做一隻機械手臂拿實體棋子取棋 然後落子在棋盤上 光是第一手天元 這個動作可能就要訓練幾個小時 實體世界的維度超乎想像得高 然後機械零件是有壽命的 除非AI能真正發展出像人腦一樣的推理能力 不然以現有RL那樣讓機器人在一個環境瞎雞巴亂弄 就算有錢如馬斯克也是會被實體世界的複雜度擊垮 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 96.230.198.240 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Tech_Job/M.1729128577.A.D09.html

10/17 09:42, 1月前 , 1F
這個第一手天元太熟悉了
10/17 09:42, 1F

10/17 10:01, 1月前 , 2F
其實就算不第一手天元應該也能贏
10/17 10:01, 2F

10/17 11:46, 1月前 , 3F
Omniverse
10/17 11:46, 3F

10/17 12:55, 1月前 , 4F
RL目前看到比較多在封閉的倉儲agv 應用
10/17 12:55, 4F

10/17 13:21, 1月前 , 5F
想這麼多 不考慮亞洲大外包嗎?
10/17 13:21, 5F

10/17 13:37, 1月前 , 6F
其實loss寫得出來的問題都沒有必要用RL阿
10/17 13:37, 6F

10/19 10:39, 1月前 , 7F
sim2real研究研究
10/19 10:39, 7F
文章代碼(AID): #1d46Y1q9 (Tech_Job)
文章代碼(AID): #1d46Y1q9 (Tech_Job)