Re: 台灣本土語言互譯及語音合成系統

看板TW-language (臺語板)作者 (NA)時間19年前 (2005/05/20 14:49), 編輯推噓2(200)
留言2則, 2人參與, 最新討論串3/4 (看更多)
剛剛去玩了一下, 發現我想錯了. 他並不是有語法標記的語料庫. 他只是在提供發音. 之所以斷成這樣: 資訊 工程 學 研究所 應該只是因為他有這些詞的錄音. 這跟語法的標記大概無關. 他還有文白可以選. 板大是選了白話音吧. 如果選文讀,他就念hak8. 總之他就只是提供發音. 至於什麼時候該念那一種音, 他就無能為力了. 這個就需要加上語法的標記才做得到. 附帶一提, oh8 不見得是動詞喔. "大學"在廈門跟南洋都是叫做 toa7-oh8 他們來念"資訊工程學"的話, 我相信應該也是有許多人會念成 chu1-sin3 kang1-theng5 oh8 吧 只是台灣習慣念成 hak8. ※ 引述《skylm (NA)》之銘言: : ※ 引述《Richter78 (The Enigma)》之銘言: : : 我剛剛輸入「資訊工程學研究所」 : : 結果被斷句成: : : 資訊工程 學 研究所 : : 那個「學」被當成動詞唸成 oh8 : : XDDD : 可見這個斷詞的系統還不夠成熟. : 我不知道他背後有多大的語料庫作基礎. : 但是這個斷法看起來, : 這個系統在語意訊息的標記上是不足的. : 所以"資訊工程"可以當成學習的主體. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.219.2

218.166.58.239 05/20, , 1F
原來如此 Orz
218.166.58.239 05/20, 1F

11/28 15:43, , 2F
他們沒有文言音?
11/28 15:43, 2F
文章代碼(AID): #12ZOXrF6 (TW-language)
文章代碼(AID): #12ZOXrF6 (TW-language)