Spaces:
Running
Running
Update app.py
Browse files
app.py
CHANGED
|
@@ -27,6 +27,11 @@ try:
|
|
| 27 |
tts_model = VitsModel.from_pretrained("facebook/mms-tts-kaz").to(device)
|
| 28 |
tts_tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-kaz")
|
| 29 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 30 |
# Перевод ru -> kk
|
| 31 |
translator = pipeline(
|
| 32 |
"translation",
|
|
@@ -117,7 +122,7 @@ def synthesize_audio(text_ru: str):
|
|
| 117 |
inputs = tts_tokenizer(text_kk, return_tensors="pt").to(device)
|
| 118 |
|
| 119 |
with torch.no_grad():
|
| 120 |
-
output = tts_model(**inputs
|
| 121 |
|
| 122 |
waveform = output.waveform.squeeze().cpu().numpy()
|
| 123 |
waveform /= np.max(np.abs(waveform)) + 1e-8 # Нормализация для лучшего качества
|
|
|
|
| 27 |
tts_model = VitsModel.from_pretrained("facebook/mms-tts-kaz").to(device)
|
| 28 |
tts_tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-kaz")
|
| 29 |
|
| 30 |
+
# Настройка конфигурации для более приятного и выразительного голоса
|
| 31 |
+
tts_model.config.noise_scale = 0.5 # Меньше шума для чище голоса
|
| 32 |
+
tts_model.config.noise_scale_duration = 0.8 # Вариация в длительности
|
| 33 |
+
tts_model.config.speaking_rate = 0.9 # Чуть медленнее для выразительности
|
| 34 |
+
|
| 35 |
# Перевод ru -> kk
|
| 36 |
translator = pipeline(
|
| 37 |
"translation",
|
|
|
|
| 122 |
inputs = tts_tokenizer(text_kk, return_tensors="pt").to(device)
|
| 123 |
|
| 124 |
with torch.no_grad():
|
| 125 |
+
output = tts_model(**inputs)
|
| 126 |
|
| 127 |
waveform = output.waveform.squeeze().cpu().numpy()
|
| 128 |
waveform /= np.max(np.abs(waveform)) + 1e-8 # Нормализация для лучшего качества
|