CAFE

팟플레이어 Q&A

소리로 자막 생성 관련.. 오류메시지

작성자ALBATO|작성시간24.12.23|조회수2,659 목록 댓글 1

안녕하세요, 저번에 자막이 아예 생성되지 않는 오류에 대해 질문 남겼는데
사용자 계정명 혹은 위스퍼 폴더 경로에 한글이 추가되어있지 않으면 적용될 것이다 라는 답변 해주셔서

 

아예 G:\ 에만 두니 잘 적용 되는가 했는데,

CUDA,CPU,Vulkan 등.. 모든 엔진 적용해봐도, 생각보다 자막 퀄리티가 그렇게 좋게 나오지는 않네요.

 

그래서 검색해보니 Faster로 하면 괜찮게 나온다고 해서 Faster로 시도해보니

 

 

usage: whisper-faster.exe [-h] [--model MODEL] [--model_dir MODEL_DIR]

             [--device DEVICE] [--output_dir OUTPUT_DIR]

             [--output_format {lrc,txt,text,vtt,srt,tsv,json,all}]

             [--verbose VERBOSE] [--task {transcribe,translate}]

             [--language {af,am,ar,as,az,ba,be,bg,bn,bo,br,bs,ca,cs,cy,da,de,el,en,es,et,eu,fa,fi,fo,fr,gl,gu,ha,haw,he,hi,hr,ht,hu,hy,id,is,it,ja,jw,ka,kk,km,kn,ko,la,lb,ln,lo,lt,lv,mg,mi,mk,ml,mn,mr,ms,mt,my,ne,nl,nn,no,oc,pa,pl,ps,pt,ro,ru,sa,sd,si,sk,sl,sn,so,sq,sr,su,sv,sw,ta,te,tg,th,tk,tl,tr,tt,uk,ur,uz,vi,yi,yo,yue,zh,Afrikaans,Albanian,Amharic,Arabic,Armenian,Assamese,Azerbaijani,Bashkir,Basque,Belarusian,Bengali,Bosnian,Breton,Bulgarian,Burmese,Cantonese,Castilian,Catalan,Chinese,Croatian,Czech,Danish,Dutch,English,Estonian,Faroese,Finnish,Flemish,French,Galician,Georgian,German,Greek,Gujarati,Haitian,Haitian Creole,Hausa,Hawaiian,Hebrew,Hindi,Hungarian,Icelandic,Indonesian,Italian,Japanese,Javanese,Kannada,Kazakh,Khmer,Korean,Lao,Latin,Latvian,Letzeburgesch,Lingala,Lithuanian,Luxembourgish,Macedonian,Malagasy,Malay,Malayalam,Maltese,Mandarin,Maori,Marathi,Moldavian,Moldovan,Mongolian,Myanmar,Nepali,Norwegian,Nynorsk,Occitan,Panjabi,Pashto,Persian,Polish,Portuguese,Punjabi,Pushto,Romanian,Russian,Sanskrit,Serbian,Shona,Sindhi,Sinhala,Sinhalese,Slovak,Slovenian,Somali,Spanish,Sundanese,Swahili,Swedish,Tagalog,Tajik,Tamil,Tatar,Telugu,Thai,Tibetan,Turkish,Turkmen,Ukrainian,Urdu,Uzbek,Valencian,Vietnamese,Welsh,Yiddish,Yoruba}]

             [--language_detection_threshold LANGUAGE_DETECTION_THRESHOLD]

             [--language_detection_segments LANGUAGE_DETECTION_SEGMENTS]

             [--temperature TEMPERATURE] [--best_of BEST_OF]

             [--beam_size BEAM_SIZE] [--patience PATIENCE]

             [--length_penalty LENGTH_PENALTY]

             [--repetition_penalty REPETITION_PENALTY]

             [--no_repeat_ngram_size NO_REPEAT_NGRAM_SIZE]

             [--suppress_blank SUPPRESS_BLANK]

             [--suppress_tokens SUPPRESS_TOKENS]

             [--initial_prompt INITIAL_PROMPT] [--prefix PREFIX]

             [--condition_on_previous_text CONDITION_ON_PREVIOUS_TEXT]

             [--prompt_reset_on_temperature PROMPT_RESET_ON_TEMPERATURE]

             [--without_timestamps WITHOUT_TIMESTAMPS]

             [--max_initial_timestamp MAX_INITIAL_TIMESTAMP]

             [--temperature_increment_on_fallback TEMPERATURE_INCREMENT_ON_FALLBACK]

             [--compression_ratio_threshold COMPRESSION_RATIO_THRESHOLD]

             [--logprob_threshold LOGPROB_THRESHOLD]

             [--no_speech_threshold NO_SPEECH_THRESHOLD]

             [--v3_offsets_off]

             [--hallucination_silence_threshold HALLUCINATION_SILENCE_THRESHOLD]

             [--hallucination_silence_th_temp {0.0,0.2,0.5,0.8,1.0}]

             [--clip_timestamps CLIP_TIMESTAMPS]

             [--no_speech_strict_lvl {0,1,2}]

             [--word_timestamps WORD_TIMESTAMPS]

             [--highlight_words HIGHLIGHT_WORDS]

             [--prepend_punctuations PREPEND_PUNCTUATIONS]

             [--append_punctuations APPEND_PUNCTUATIONS]

             [--threads THREADS] [--version]

             [--vad_filter VAD_FILTER]

             [--vad_threshold VAD_THRESHOLD]

             [--vad_min_speech_duration_ms VAD_MIN_SPEECH_DURATION_MS]

             [--vad_max_speech_duration_s VAD_MAX_SPEECH_DURATION_S]

             [--vad_min_silence_duration_ms VAD_MIN_SILENCE_DURATION_MS]

             [--vad_speech_pad_ms VAD_SPEECH_PAD_MS]

             [--vad_window_size_samples VAD_WINDOW_SIZE_SAMPLES]

             [--vad_dump] [--max_new_tokens MAX_NEW_TOKENS]

             [--chunk_length CHUNK_LENGTH]

             [--compute_type {default,auto,int8,int8_float16,int8_float32,int8_bfloat16,int16,float16,float32,bfloat16}]

             [--batch_recursive] [--beep_off] [--skip]

             [--checkcuda] [--print_progress] [--postfix]

             [--check_files] [--PR163_off]

             [--hallucinations_list_off] [--one_word {0,1,2}]

             [--sentence] [--standard] [--standard_asia]

             [--max_comma MAX_COMMA]

             [--max_comma_cent {50,60,70,80,90,100}]

             [--max_gap MAX_GAP]

             [--max_line_width MAX_LINE_WIDTH]

             [--max_line_count MAX_LINE_COUNT]

             [--min_dist_to_end {0,4,5,6,7,8,9,10,11,12}]

             [--prompt_max {16,32,64,128,223}]

             [--reprompt {0,1,2}]

             [--prompt_reset_on_no_end {0,1,2}] [--ff_dump]

             [--ff_track {1,2,3,4,5,6}] [--ff_fc] [--ff_mp3]

             [--ff_sync] [--ff_rnndn_sh] [--ff_rnndn_xiph]

             [--ff_fftdn [0 - 97]] [--ff_tempo [0.5 - 2.0]]

             [--ff_gate] [--ff_speechnorm] [--ff_loudnorm]

             [--ff_silence_suppress noise duration]

             [--ff_lowhighpass]

             audio [audio ...]

whisper-faster.exe: error: the following arguments are required: audio

 

이런 오류메시지가 나오면서 아예 진행이 안되는데.. 혹시 고칠 방법을 알 수 있을까요?

다음검색
현재 게시글 추가 기능 열기

댓글

댓글 리스트
  • 작성자팟플.개발자 | 작성시간 24.12.23 계정에 한글이 있어서 그런듯 하네요~~
    즉 한글이 없는 계정으로 해보시기 바랍니다.
    그래도 안되면 딱히 잘 모르겠네요~~
    whisper-faster.exe의 제작자에게 문의 해보시기 바랍니다.
댓글 전체보기
맨위로

카페 검색

카페 검색어 입력폼