[討論] 做了一個替代typeless的開源語音辨識
看板Soft_Job (軟體人)作者secretfly (乂o賈霸死鬼o乂(Jquery))時間2小時前 (2026/07/03 22:10)推噓3(3推 0噓 0→)留言3則, 3人參與討論串1/1
來貢獻一下 為這個社會付出一下(?
我發現開源社群真的很棒 有人issue 有人PR的感覺真的很棒
緣起是之前typeless在脆上很紅 因為有分潤 所以一堆部落客在推廣
但後續又爆出資安疑慮 且收費也不便宜
所以我就網路上找了各種開源的語音辨識軟體研究一下
各種模型 以及該怎麼調整參數等等的
應該幾乎能做的功課我都做了 能試試看的模型我都試了
最後居然真的讓我找到滿意的效果!!!
於是打造出了SpeakSlow聲聲慢 速度超級爆炸快
模型使用 sherpa-onnx Paraformer
然後用本地規則去+標點(省下一個模型)
其中還有很多功能 我這裡就不多作介紹了
主要是windows版本在更新 Mac的話要通過朋友們回饋協助(暫時沒環境QQ)
官網: https://jeffrey0117.github.io/SpeakSlow/
裡面也找的到REPO可以翻或是issues
也很開心
居然有被電腦王阿達寫文章介紹:https://www.koc.com.tw/archives/646444
我完全不知道 是我自己google聲聲慢意外發現的
其實當初很早就想做語音辨識了 因為我有朋友耳朵不好 就有在雅婷逐字稿
後來該APP收費後他改用google的效果不好
那時候就有這個起心動念
這些一切技術都是建立在大家開源社群的貢獻 以及Claude Code的協助 很感恩
有興趣的人可以去裝來玩 也歡迎PR
我自己目前一天大概要講一萬字吧哈哈哈 因為vibe coding嘴砲流真的很爽
以上
謝謝各位前輩 終於明白開源社群的魅力是什麼了!!!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.165.243.219 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1783087809.A.7B4.html
※ 編輯: secretfly (1.165.243.219 臺灣), 07/03/2026 22:10:42
推
07/03 22:17,
2小時前
, 1F
07/03 22:17, 1F
推
07/03 22:48,
1小時前
, 2F
07/03 22:48, 2F
推
07/04 00:11,
13分鐘前
, 3F
07/04 00:11, 3F
Soft_Job 近期熱門文章
33
83
PTT職涯區 即時熱門文章