VidnozAI Talking Head 教學

Author: Kelvin Huang

使用 Vidnoz AI 提供的免費 AI 照片說話工具 - AI 照片說話免費版，讓您製作模擬照片說話影片！

請從 Avatar 標籤上傳照片，或選擇一張照片並輸入文字，即可生成 AI 說話肖像，支援多種語言。

確認擁有圖片的版權或有合法使用權，可以使用 AI 製作會說明的 Avatar 形象（例如 ChatGPT 生圖）。

選擇聲音，例如希望是中文且不要有大陸口音，可選擇中文 - TW > 男 > YunJhe (Taiwan)

女生則有 HsiaoYou (Taiwan), HsiaoChen (Taiwan) 可選擇。

選項可調整速度與音調。注意！速度是直接調整，所以不太自然。音調類似變音器的效果。字幕預設開啟（可關閉字幕）。

按下生成後，將出現「準備生成您的影片」訊息，將扣除影片的時長，請檢視並確認內容後，再點擊「立即生成」按鈕。

練習用素材可至 http://www.3dxr.com.tw/VidnozAI-Talking-Head/ 網頁下載

中英文組合句子的生成問題

使用 Vidnoz AI 文字轉語音功能，可能發現中英文組合的句子唸出來的聲音怪怪的，例如我需要的是 M E L 每個字母單獨唸，可是實際輸出變成 MEL ，有沒有解決方法？例如輸入文字改為有母音加尾音的方式？

這個問題屬於拼字字母（Spelling）無法正確逐字朗讀的情況，很多 TTS 文字轉語音系統常見的限制，尤其是像 Vidnoz AI 這類主要優化為朗讀自然語句的引擎。解決方式建議如下：

讓系統知道你是要逐字念：

輸入：M E L（可能部分系統仍會自動合併）

改為輸入：M - E - L 或 M. E. L.

有些系統對「破折號」或「句點」會做語音停頓與字母化處理。

你提到的方法很有效：讓每個字母帶上「類似唸法的音節」，以下是常用對照表：

範例應用

要讓 TTS 唸出 M E L，可以輸入其中一種方式：

M - E - L

Em Ee El（使用發音對照）

M. E. L.（有時會成功）

Em, Ee, El.（加入逗號幫助停頓）