[心得] 我做了一個輕量語義搜尋引擎

看板Soft_Job (軟體人)作者 (無聞)時間3小時前 (2025/11/19 09:01), 3小時前編輯推噓2(206)
留言8則, 3人參與, 1小時前最新討論串1/1
PipOwl:可嵌入任何 Python 專案的輕量語義搜尋引擎(核心約 10KB) PipOwl 是從我大型語義專案中抽離出來的 最安全、最不敏感、最容易被整合的一層。 它的定位是: 輕量語義搜尋引擎(Mini Semantic Engine) 純 Python 實作,不含 C/C++ 原生模組 額外依賴皆為常見 NLP 套件(numpy / sentence-transformers) 可用於 CLI / API / Chatbot / IME本地即時執行(接近輸入法候選速度) 適合做:語句相似度、意圖比對、快速原型開發 安裝方式:pip install pipowl GitHub:https://github.com/galaxy4552/Pipowl PyPI:pip install pipowl 如果你對中文語義系統、向量表示、或極簡的 semantic engine 有興趣,歡迎一起討論。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.167.188 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1763514061.A.5E0.html ※ 編輯: galaxy4552 (114.136.167.188 臺灣), 11/19/2025 09:09:45

11/19 09:33, 3小時前 , 1F
all-MiniLM-L6-v2?有試過EmbeddingGemma-300m?現在中文那
11/19 09:33, 1F

11/19 09:34, 3小時前 , 2F
個embedding model是最推薦的?
11/19 09:34, 2F

11/19 10:36, 2小時前 , 3F
上次-新酷鷹的事,有沒有後續...?
11/19 10:36, 3F

11/19 10:40, 2小時前 , 4F
我比較偏向做語義引擎 / pipeline 的研究
11/19 10:40, 4F

11/19 10:41, 2小時前 , 5F
所以沒有大量 benchmark 各種模型。
11/19 10:41, 5F

11/19 10:41, 2小時前 , 6F
PipOwl 把 embedding layer 抽掉,想塞哪顆MODEL都行
11/19 10:41, 6F

11/19 10:42, 2小時前 , 7F
回lchcoding 謝謝你記得 這個就是後續 目前還在開發
11/19 10:42, 7F

11/19 10:59, 1小時前 , 8F
理解,晚上看
11/19 10:59, 8F
文章代碼(AID): #1f7HRDNW (Soft_Job)
文章代碼(AID): #1f7HRDNW (Soft_Job)