ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 음성인식 toolkit 도입
    음성인식 2021. 10. 12. 12:00

    현재 open source 로 나와있는 여러 toolkit 들이 있다.

    HTK, Kaldi, espnet, 그리고 최근에 speechbrain ... 등 수도 없이 많다

    HTK 는 개발이 중단된지 오래되었고,
    Kaldi HMM 기반의 음성인식기이다. 여전히 많이 이용되는 것 같지만 메인 개발자분이신 Daniel Povey 박사님께서 프로젝트에서 나가셨기 때문에 HTK처럼 곧 개발이 중단될 것 같다.

    espnet 은 end-to-end asr로부터 시작해서 현재는 TTS, enhancement, 등 음성 관련 다양한 기능을 제공한다.

    speech brain은 개발 초기부터 컨셉을 다양한 음성 관련 기능을 제공하는 툴킷을 목표로 하였다고 한다. 해당 toolkit의 논문을 보니 참여한 개발자의 회사가 다양하고, 문서화가 잘 되어있다고 해서 기대가 되는 툴킷이다. 

     

    몇개월 동안 스크립트를 읽으면서 익히게 된 kaldi, espnet 을 사용하는 방법에 대한 포스팅도 할 예정이고

    앞으로 졸업하기 전까지 speechbrain 도 사용해보고 나름대로의 장단점을 파악해보도록 해야겠다.

    '음성인식' 카테고리의 다른 글

    ASR system overview  (0) 2022.12.14
    espnet 사용법  (0) 2022.04.06

    댓글

열심히 살자!