VidnozAI Talking Head 教學

Author: Kelvin Huang

使用 Vidnoz AI 提供的免費 AI 照片說話工具 - AI 照片說話免費版,讓您製作模擬照片說話影片!

請從 Avatar 標籤上傳照片,或選擇一張照片並輸入文字,即可生成 AI 說話肖像,支援多種語言。

確認擁有圖片的版權或有合法使用權,可以使用 AI 製作會說明的 Avatar 形象(例如 ChatGPT 生圖)。

選擇聲音,例如希望是中文且不要有大陸口音,可選擇 中文 - TW > 男 > YunJhe (Taiwan)

女生 則有 HsiaoYou (Taiwan), HsiaoChen (Taiwan) 可選擇。

選項可調整速度與音調。注意!速度是直接調整,所以不太自然。 音調類似變音器的效果。字幕預設開啟(可關閉字幕)。

按下生成後,將出現「準備生成您的影片」訊息,將扣除影片的時長,請檢視並確認內容後,再點擊「立即生成」按鈕。

 

練習用素材可至 http://www.3dxr.com.tw/VidnozAI-Talking-Head/ 網頁下載

 

中英文組合句子的生成問題

使用 Vidnoz AI 文字轉語音功能,可能發現中英文組合的句子唸出來的聲音怪怪的,例如我需要的是 M E L 每個字母單獨唸,可是實際輸出變成 MEL ,有沒有解決方法?例如輸入文字改為有母音加尾音的方式?

這個問題屬於 拼字字母(Spelling)無法正確逐字朗讀 的情況,很多 TTS 文字轉語音系統常見的限制,尤其是像 Vidnoz AI 這類主要優化為朗讀自然語句的引擎。解決方式建議如下:

 

方法 1:在每個字母之間加空格或破折號

讓系統知道你是要逐字念:

輸入:M E L(可能部分系統仍會自動合併)

改為輸入:M - E - L 或 M. E. L.

有些系統對「破折號」或「句點」會做語音停頓與字母化處理。

 

方法 2:使用拼音輔助音節技巧

你提到的方法很有效:讓每個字母帶上「類似唸法的音節」,以下是常用對照表:

字母 建議寫法 說明
A ay / ei A = 「欸」
B bee B = 「比」
C see C = 「西」
D dee D = 「滴」
E ee E = 「伊」
F eff F = 「愛夫」
G gee G = 「機」
H aitch 可試 「H = eitch」
I eye I = 「愛」
J jay J = 「傑」
K kay  
L el L = 「ㄟ歐」
M em M = 「欸母」
N en N = 「恩」
O oh O = 「歐」
P pee P = 「屁」
Q cue  
R ar R = 「阿爾」
S ess  
T tee T = 「踢」
U you U = 「優」
V vee  
W double you  
X ex  
Y why  
Z zee / zedd 美式 = zee / 英式 = zedd

 

範例應用

要讓 TTS 唸出 M E L,可以輸入其中一種方式:

M - E - L

Em Ee El(使用發音對照)

M. E. L.(有時會成功)

Em, Ee, El.(加入逗號幫助停頓)

 

Copyright © 2025 CG Digital Corp. All rights reserved.