Spaces:

intelli-zen
/

asr

Sleeping

HoneyTian commited on May 11, 2024

Commit

3e60665

1 Parent(s): 2fb8b3a

update

Files changed (4) hide show

.gitattributes CHANGED Viewed

@@ -34,3 +34,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 *.wav filter=lfs diff=lfs merge=lfs -text

 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 *.wav filter=lfs diff=lfs merge=lfs -text
+*.whl filter=lfs diff=lfs merge=lfs -text

examples/wenet/toolbox_infer.py CHANGED Viewed

@@ -18,7 +18,7 @@ import torchaudio
 from project_settings import project_path, temp_directory
 from toolbox.k2_sherpa.utils import audio_convert
-from toolbox.k2_sherpa import decode, models
 def get_args():
@@ -51,13 +51,13 @@ def main():
                   )
     # load recognizer
-    m_dict = models.model_map["Chinese"][0]
     local_model_dir = Path(args.model_dir)
     nn_model_file = local_model_dir / m_dict["nn_model_file"]
     tokens_file = local_model_dir / m_dict["tokens_file"]
-    recognizer = models.load_recognizer(
         repo_id=m_dict["repo_id"],
         nn_model_file=nn_model_file.as_posix(),
         tokens_file=tokens_file.as_posix(),

 from project_settings import project_path, temp_directory
 from toolbox.k2_sherpa.utils import audio_convert
+from toolbox.k2_sherpa import decode, nn_models
 def get_args():
                   )
     # load recognizer
+    m_dict = nn_models.model_map["Chinese"][0]
     local_model_dir = Path(args.model_dir)
     nn_model_file = local_model_dir / m_dict["nn_model_file"]
     tokens_file = local_model_dir / m_dict["tokens_file"]
+    recognizer = nn_models.load_recognizer(
         repo_id=m_dict["repo_id"],
         nn_model_file=nn_model_file.as_posix(),
         tokens_file=tokens_file.as_posix(),

main.py CHANGED Viewed

@@ -21,7 +21,7 @@ import torch
 import torchaudio
 from toolbox.k2_sherpa.examples import examples
-from toolbox.k2_sherpa import decode, models
 from toolbox.k2_sherpa.utils import audio_convert
 main_logger = logging.getLogger("main")
@@ -40,10 +40,10 @@ def get_args():
 def update_model_dropdown(language: str):
-    if language not in models.model_map.keys():
         raise ValueError(f"Unsupported language: {language}")
-    choices = models.model_map[language]
     choices = [c["repo_id"] for c in choices]
     return gr.Dropdown(
         choices=choices,
@@ -88,7 +88,7 @@ def process(
                   )
     # model settings
-    m_list = models.model_map.get(language)
     if m_list is None:
         raise AssertionError("language invalid: {}".format(language))
@@ -104,7 +104,7 @@ def process(
     nn_model_file = local_model_dir / m_dict["nn_model_file"]
     tokens_file = local_model_dir / m_dict["tokens_file"]
-    recognizer = models.load_recognizer(
         repo_id=m_dict["repo_id"],
         nn_model_file=nn_model_file.as_posix(),
         tokens_file=tokens_file.as_posix(),
@@ -202,10 +202,10 @@ def main():
     title = "# Automatic Speech Recognition with Next-gen Kaldi"
-    language_choices = list(models.model_map.keys())
     language_to_models = defaultdict(list)
-    for k, v in models.model_map.items():
         for m in v:
             repo_id = m["repo_id"]
             language_to_models[k].append(repo_id)

 import torchaudio
 from toolbox.k2_sherpa.examples import examples
+from toolbox.k2_sherpa import decode, nn_models
 from toolbox.k2_sherpa.utils import audio_convert
 main_logger = logging.getLogger("main")
 def update_model_dropdown(language: str):
+    if language not in nn_models.model_map.keys():
         raise ValueError(f"Unsupported language: {language}")
+    choices = nn_models.model_map[language]
     choices = [c["repo_id"] for c in choices]
     return gr.Dropdown(
         choices=choices,
                   )
     # model settings
+    m_list = nn_models.model_map.get(language)
     if m_list is None:
         raise AssertionError("language invalid: {}".format(language))
     nn_model_file = local_model_dir / m_dict["nn_model_file"]
     tokens_file = local_model_dir / m_dict["tokens_file"]
+    recognizer = nn_models.load_recognizer(
         repo_id=m_dict["repo_id"],
         nn_model_file=nn_model_file.as_posix(),
         tokens_file=tokens_file.as_posix(),
     title = "# Automatic Speech Recognition with Next-gen Kaldi"
+    language_choices = list(nn_models.model_map.keys())
     language_to_models = defaultdict(list)
+    for k, v in nn_models.model_map.items():
         for m in v:
             repo_id = m["repo_id"]
             language_to_models[k].append(repo_id)

toolbox/k2_sherpa/{models.py → nn_models.py} RENAMED Viewed

File without changes