AlserFurma commited on
Commit
ee0187d
·
verified ·
1 Parent(s): f1b66ce

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +6 -1
app.py CHANGED
@@ -27,6 +27,11 @@ try:
27
  tts_model = VitsModel.from_pretrained("facebook/mms-tts-kaz").to(device)
28
  tts_tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-kaz")
29
 
 
 
 
 
 
30
  # Перевод ru -> kk
31
  translator = pipeline(
32
  "translation",
@@ -117,7 +122,7 @@ def synthesize_audio(text_ru: str):
117
  inputs = tts_tokenizer(text_kk, return_tensors="pt").to(device)
118
 
119
  with torch.no_grad():
120
- output = tts_model(**inputs, noise_scale=0.7, noise_scale_w=0.9, length_scale=1.2)
121
 
122
  waveform = output.waveform.squeeze().cpu().numpy()
123
  waveform /= np.max(np.abs(waveform)) + 1e-8 # Нормализация для лучшего качества
 
27
  tts_model = VitsModel.from_pretrained("facebook/mms-tts-kaz").to(device)
28
  tts_tokenizer = AutoTokenizer.from_pretrained("facebook/mms-tts-kaz")
29
 
30
+ # Настройка конфигурации для более приятного и выразительного голоса
31
+ tts_model.config.noise_scale = 0.5 # Меньше шума для чище голоса
32
+ tts_model.config.noise_scale_duration = 0.8 # Вариация в длительности
33
+ tts_model.config.speaking_rate = 0.9 # Чуть медленнее для выразительности
34
+
35
  # Перевод ru -> kk
36
  translator = pipeline(
37
  "translation",
 
122
  inputs = tts_tokenizer(text_kk, return_tensors="pt").to(device)
123
 
124
  with torch.no_grad():
125
+ output = tts_model(**inputs)
126
 
127
  waveform = output.waveform.squeeze().cpu().numpy()
128
  waveform /= np.max(np.abs(waveform)) + 1e-8 # Нормализация для лучшего качества