[新聞] 大神Karpathy強烈建議：透過做專案來學習已刪文

看板Tech_Job (科技人)作者jackliao1990 (j)時間4月前 (2024/07/06 17:59)推噓10(11推 1噓 3→)

留言15則, 13人參與討論串1/1

大神卡帕西強烈建議：透過做專案來學習，堅持“1萬小時定律” https://www.thepaper.cn/newsDetail_forward_27973111 一水發自凹非寺現場掌聲雷動！大神Andrej Karpathy在柏克萊黑客馬拉鬆的演講再引熱議。我們似乎正步入一個全新的運算範式，類似電腦技術在1980年代的轉型。我們正在進入的新範式，大語言模型就像CPU一樣，使用Token而不是字節，並且有一個上下文視窗而不是RAM，這就是大語言模型作業系統（Large Language Model OS, LMOS）。隨後在18分鐘左右的演講中，Karpathy分享了從15年前初次接觸人工智慧至今的感受。過程中也回顧了在OpenAI的經歷，描述了公司從八個人在公寓工作到如今成為市值近千億美元的行業巨頭。不過，正如網友們所提醒的：最精華的在最後，透過做專案來學習，找到合適的獎勵模式，讓大腦進入良性循環。 get！接下來就讓我們一起品品這場被網友評價為「乾貨滿滿」的演講。以下為卡帕西開幕演講內容整理步入全新運算範式大家好，感謝邀請我來。我非常喜歡黑客馬拉松，因為這裡蘊含著巨大的能量和創造力。年輕人在一起學習和創新，這是我最喜歡的地方。我也參加過不少黑客馬拉松，所以很高興能在這裡和大家交流。今天的會場規模之大，超出了我的預期。黑客馬拉鬆的盛大，反映出人工智慧在過去十五年間的快速發展。我自15年前首次接觸人工智慧，當時的AI僅限於小規模學術討論，專注於數學細節的推敲。當時我們訓練神經網路使用的是來自MNIST的小數字，我們訓練受限玻爾茲曼機，使用對比散度訓練網路。而今，AI已非昔日之景象。 NVIDIA，作為GPU 的主要生產商，已躍升為美國市值最大的公司之一，引領產業發展。我們正生活在一個獨特且充滿活力的時代，眾多的黑客馬拉松賽事便是明證。我認為，這一切的背後，是計算本質的深刻改變。我們似乎正步入一個全新的計算範式，類似於電腦技術在1980年代的轉型（當時電腦進入了PC時代）。目前，我們所運用的不再是執行位元組指令的中央處理器，而是處理字串片段的大型語言模型。這些模型，連同上下文視窗、儲存設備等，構成了一種新型的運算架構，我稱之為大型語言模型作業系統，或簡稱LLM OS。這是一種全新的程式設計學習對象，我們正在探索其優勢與限制，並思考如何將其有效融入產品開發中。數週前，OpenAI發布了GPT-4o的演示，這項演示讓我們直觀感受到了與AI交流的可能性。它不僅能夠回應語音指令，還能進行視覺辨識、繪畫等多元任務。我強烈推薦各位觀看電影《她》，在這部電影裡，主角與一個被稱為操作系統的AI進行對話，我認為這部電影非常接近現實。然而，電影中的AI著重於情感智能，而在現實世界中，我們的社會更可能利用這些模型來解決數位空間中的各類問題。這些數位實體不僅可以執行任務，還能進行交流與協作，甚至模擬Slack對話，自動化數位基礎架構。儘管實體基礎設施的自動化尚處於起步階段，但其潛力不容忽視。此外，我還想推薦另一部2004年威爾史密斯主演的電影《我，機器人》。這部電影設想了一個機器人在社會中廣泛執行任務的未來。劇透一下，在電影裡，人們的生活並沒有變得更好，反而似乎被機器人主導。我認為這個設想相當有趣。電影中描繪的故事發生在2035年，也就是十年後。也許那時我們可能生活在，機器人在我們周圍走動、和我們交談、在實體世界和數位世界中執行任務的環境中。那會是什麼樣子呢？我們如何去程式設計？我們怎樣才能讓它們按照我們的預期進行操作？當你考慮所有這些因素時，你可能會有一種通用人工智慧的感覺。這意味著你深刻地理解了，如果這些技術繼續發展，我們可能會在不遠的將來遇見什麼。我們可能在數位領域和實體領域實現大規模的自動化。現在，我不知道你們的想法，但我個人對這個情景感到有些沮喪。這是我用過去幾分鐘的談話內容作為輸入，用圖像生成器產生的圖片。實際上，我並不喜歡這幅畫。我覺得我們可以做得更好，我們這裡有幾千人。在座的各位即將踏入AI產業，你們將對這些科技的發展擁有一定的影響力。我們所期望的未來，應是人與自然和諧共存，自動化技術隱於幕後，不顯山露水。滾雪球效應接下來，我想分享一些個人經驗。我認為我了解了專案如何變成現實世界的變革。我發現的第一件很神奇的事情是，有時很小的項目，就像小雪球一樣，實際上可以發展成非常大的項目。我曾經做過一個小型的魔術方塊顏色擷取器專案。另外，13年前，我在YouTube上發布了一些遊戲編程教程，嘗試教人們如何進行遊戲編程，我有很多視頻遊戲。我還有一個有趣的神經進化模擬器。並非所有這些項目都能產生雪球效應，許多只是探索和嘗試。事實上，這三個項目對我來說並沒有產生太大的影響。不能說它們是無用功，只是沒有為我帶來預期的效果，它們仍然對我有幫助。但遊戲編程教程卻以某種方式為我帶來了雪球效應，這引導我從遊戲編程教程轉向了一些頗受歡迎的魔方視頻，這激發了我對教學的熱情。後來，當我在史丹佛大學攻讀博士學位時，有幸開設並教授了CS231N課程，這是史丹佛大學的首門重點深度學習課程。之後，我創建了一個YouTube頻道，推出了為深度學習和大語言模型製作的「從零到高手」系列，很多人都喜歡這個。在此基礎上，雪球效應持續，我目前非常感興趣的一個專案是下一步的課程。我將這個課程命名為LLM 101N，目的是教你創建一個說故事的工具，類似於你可以用來產生故事的 ChatGPT。這個課程的設計想法是讓你從零開始學習，從基礎知識到創造一個在說故事領域的類似 ChatGPT的工具。我認為，從頭開始學習創建這個工具將是非常有啟發性的，也會非常有趣。兩三天前，我在GitHub上發布了這個課程，它還很初級，但我對此非常興奮。對我來說，這就像是一顆滾雪球，越滾越大。它始於13年前的一個小遊戲程式設計。在OpenAI，我也親眼見證了類似的過程。如同先前簡單提到的，我是OpenAI的創始成員，研究員。七年前，我在OpenAI工作，這是一些公開的圖片，展示了我們八個人在Greg的公寓工作的情況。 OpenAI的創立就是為了與Google展開競爭。 Google就像是一隻擁有700億美元自由現金流的大猩猩。那時，Google幾乎僱用了AI研究行業的一半人員。這是一個相當有趣的格局，而我們只是八個帶著筆記型電腦的人。 OpenAI在內部探索了大量的項目，我們聘請了一些非常優秀的人才，許多人的專案並未取得太大進展，但有些人的專案確實取得了成效。舉例來說，在OpenAI早期歷史中，有人在研發一個Reddit的聊天機器人。當你瞥見他們的桌子，你可能會問，我們正在試圖與Google競爭，你正在開發一個Reddit的聊天機器人。我們應該做一些更大的事情。因此，這些剛起步的項目很容易被忽視，因為它們在初期非常脆弱。但實際上，Reddit聊天機器人是什麼？它是一個語言模型。而且恰好是在Reddit上進行訓練的。不過，你完全可以利用任何資料來訓練這樣的語言模型，並不僅限於Reddit。當Transformer出現後，這個模型變得更為完善。然後，其應用領域從只有Reddit擴展到許多其他的網頁。突然之間，你就可以看到GPT-1，GPT-2，3，4，最後是GPT-4o的出現。所以，這個看似不起眼的Reddit聊天機器人，最後卻催生了GPT-4o，我們現在認為它是運算範式的改變。你可以和它對話，它的回應令人驚艷。今天，OpenAI的估值可能接近1000億美元。看到小雪球逐漸滾成大雪球的成果，令人難以置信。所以我想說，你應該堅持你的項目，讓它們逐漸積累，也許它們可以變成大雪球。此外，我堅信Malcolm Gladwell提出的「一萬小時」定律。我認為，成功源自於重複的實踐和大量的付出。不要過度緊張，我在做些什麼？我是成功還是失敗？只要簡單地統計你投入的時間，一切都會累積起來。有幾個例子可以說明這一點。幾週前，我在周末製作了一個非常粗糙的網站awesomemovies.life。因為那個週六我想看電影，所以我就上線了這個電影推薦引擎網站。有人在推特上回覆我說：「哇，你週末就搞定了，好酷啊。」我對此產生了些許思考，因為我並不覺得這有多麼神奇。這個人沒看到的是，這已經是我第20次做這樣的網站了，我知道我要做的每一步。首先，我需要Linode，然後是Flask伺服器。我寫一些JavaScript，樣式表，HTML，然後把這些組合起來。我需要抓取所有這些網頁，提取tf.idf 向量，訓練SVM。這些都是我已經做過20次的事情，我甚至有之前項目的代碼片段。我只是在重新組合我已有的資源，因此可以在一個周末完成。另一個例子是我在特斯拉自動駕駛專案中的經歷。大約7、8 年前，我被聘請來領導特斯拉自動駕駛的電腦視覺團隊。加入團隊後，我做的第一件事之一就是用PyTorch重新編寫電腦視覺深度學習網路訓練的程式碼庫。我基本上從頭開始重新編寫了整個項目，它現在成了項目的核心部分。對某些人來說，這在當時看起來可能很驚人，但對我來說並非如此。因為我在讀博期間花了五年時間做類似的事情，我清楚知道需要什麼。我需要訓練集，評估集，我需要在PyTorch中的訓練循環，我需要配置文件，我需要日誌目錄，我需要引入ResNet，我需要做檢測，我們正在進行回歸和分類。整個過程，我預見了所有步驟，而這種預見只有經驗才能帶來。因此，真正去嘗試達到你的10,000個小時，這真的會有很大的影響，這就是全部。順便說一下，10,000個小時，如果你每天工作六小時，大約需要五年。所以，你需要大約像完成一個博士學位的時間來在某個領域發展出專業技能。牆裂推薦“做專案” 我還發現，保持大腦釋放多巴胺其實很有用。你要了解你的心理狀況，你的大腦，它是如何運作的，維持活力，如何保持受到啟發。特別是，你的大腦就像一個獎勵機器，它渴望得到獎勵，你需要滿足這個需求。那麼，有什麼好的方法可以給予獎勵呢？在我的經驗中，這可以透過做項目，並且持續發布它們來實現。首先，專案能讓你全面深入地做一些事情。例如，當你去上課時，你通常是在廣泛地學習，而專案是讓你根據需求來學習。我認為這是一種非常不同的學習模式，很好地補充了廣泛的學習方式，這非常重要。另一個原因是，發布項目其實也是一個非常好的策略。如果你打算發布一些東西，那麼你會開始考慮所有可能看到它的人，你的朋友、團隊成員、家人和未來的雇主。因此，這無疑提高了你對自己工作的要求，會讓你更努力地工作。因為別人會評價你的工作，如果工作品質差，你會感到羞愧，這種壓力有時是有幫助的。且當他人關注你的專案時，你會得到滿足感。總的來說，我認為這就是事情的大致運作方式，所傳達的訊息就是不斷的挑戰。希望我們能從小專案做起，共同創造一個美好的未來。謝謝大家。還有一件事最後，「keep hacking」的卡帕西最近也開始玩AI影片生成了！他把《傲慢與偏見》的前幾句話做成了視頻，用的工具還是大雜燴那種~ 據他透露，其「配方」如下：用Claude完成了第一章，產生了場景和圖像的單獨提示用Ideogram按照提示產生圖像用Luma處理圖像並將其動畫化用ElevenLabs處理旁白用Veed進行最終縫合這一番操作花了大神將近1小時，以至於他在線發問：對於任何能夠提供便利的人來說，這裡都有一個巨大的講故事的機會。誰正在打造第一家100%AI原生電影製作? 那麼，你覺得卡帕西的這個影片如何？（歡迎在留言處隨意留言）參考連結： [1]https://www.youtube.com/watch?v=tsTeEkzO9xc