網站簡介
- 本站提供免費的中古漢語「切韻音系」擬音的語音合成(TTS)工具:將漢字文本轉換爲切韻音系轉寫,並合成擬音朗讀音頻,可在線播放與下載。本站作者爲 cinix。
- 受限於當前服務器性能,音頻生成速度可能較慢,且存在文本長度限制。若您喜歡並願意支持本站,可掃描頁面最下方的二維碼捐贈善款,爲網站硬件升級,以及未來的模型迭代助力。感謝您的支持!
使用方法
- 在「漢字輸入」文本框中輸入待合成的漢字文本。
「漢字輸入」字符總數不可超過 100 個。
- 輸入完成後,「字音選擇」下方會自動列出每個字符及其轉寫和釋義。可通過表單右上方的篩選器篩選「多音字」或「未知字符」。
「未知字符」即不在本 TTS 所使用的字表中的字符。「未知字符」存在時,將默認對其開啓篩選,並以紅色標記所在行。
- 在「字音選擇」中可手動選擇每個多音字的字音,「轉寫預覽」會自動同步當前選擇結果。
本站展示的「釋義」絕大多數爲《廣韻》釋義。在《廣韻》外有少量字頭和釋義的增補,見下「模型、資料、轉寫與釋義」處。
「釋義」前的方頭括號內加註當前所選「轉寫」對應的中古音地位。請注意:韻母使用了更接近《切韻》原貌的名稱(【真】而非【諄】,【殷】而非【欣】,【寒】【末】而非【桓】【曷】,【哥】而非【歌】【戈】),並將【臻】韻也併入了【真】韻。
- 若有需要,可對「轉寫預覽」開啓「手動編輯」。開啓後其不再與「字音選擇」保持同步。
「轉寫預覽」字符總數不可超過 600 個,且所有字符須在「轉寫字符集」中。「轉寫字符集」爲:
" ,.abdeghijklmnopstuwyzŋɑɕɖəɦɨɲɳʂʈʉʐʑʔʣʥʦʨʰʷː̀́̌ạẹịọỵꭦꭧ"
- 確認轉寫無誤,並選擇要使用的模型後,在「語音合成」區域中點擊「生成語音」按鈕,系統將根據轉寫生成音頻。
不同模型之間無系統性的發音差異。若您發現某個模型輸出的音頻有明顯不自然或是發音錯誤的情況,可嘗試使用其他模型。
音頻生成完畢後將自動播放,並出現「下載當前音頻」按鈕。點擊按鈕可將當前音頻下載到本地。
模型、資料、轉寫與釋義
- 本 TTS 模型基於 GitHub 項目 vits2_pytorch 訓練。
- 訓練數據來自 cinix 的個人錄音。
- 本站使用的切韻音系轉寫方案總體類似於當前主流的切韻擬音。但爲了優化 TTS 模型的訓練,在儘可能使用國際音標(IPA)的同時,平均化每個音節的字符數,因此在一些地方稍異於常見切韻擬音/轉寫:
對於塞擦音聲母【精】【清】【從】【莊】【初】【崇】【章】【昌】【常】,本方案用到了二合字母:
ʦ ʦʰ ʣ ꭧ ꭧʰ ꭦ ʨ ʨʰ ʥ
對於二等元音和三等 B 類(及其對應的【莊】組小韻)的元音/介音,本方案使用下加點的元音字母來表示:
ạ ẹ ị ọ ỵ
對沒有韻尾的韻母,本方案使用 IPA 的長音符號作爲其形式韻尾,以增加其字符數,如:
iː ʉuː uː ieː ẹː ɨəː ʉoː oː iaː ạː ɑː
- 本方案區分了廣韻已經合併的【蒸】韻 B/C 兩類。一些聲母、韻母以及重紐類型的轄字存在爭議,若有需要您可在「轉寫預覽」中通過「手動編輯」調整其轉寫。
- 本站使用的字表(包括轉所寫依靠的中古音音韻地位與釋義)基於 poem 的 广韵字音表(20170209,poem版),並參考 unt 等製作的《王三》小韵全表進行了少量修訂和補充。因此會出現「轉寫」與「釋義」中的反切不匹配的情況。
- 在上述材料外,本站所使用的字表還增加了若干已有字的其他讀音(參考《集韻》等材料),以及若干《廣韻》未收字。對於所有在《廣韻》外增加的字頭和釋義,其「釋義」正文以井號(#)開始以示區別。
- 「字音選擇」中一些常用多音字的字音會依據其常用程度降序排列以方便使用。常用程度是在製作擬音文本的過程中得到的,僅供參考。
- 此外,「字音選擇」會將常用的中文標點轉換爲「轉寫字符集」內的標點。轉換前後情況展示在「釋義」中。
- 點擊此處可下載轉寫字表(含字頭、轉寫、釋義和常用度)。
聯絡與貢獻
- 製作不易!若您喜歡本站,懇請捐贈支持。您也可以發送反饋建議至我的郵箱:cinix.chen@gmail.com。
微信掃碼支付
支付寶掃碼支付