:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
20/06/03 11:52
말씀하신 기능을 Speach to Text 라고 합니다.
받아쓰기죠. 외국어라면 Machine Translation (기계 번역) 까지 돌리면 됩니다. 그런데 구글 번역기 돌려보시면 아시겠지만... 사람이 한 것 처럼 깔끔하게는 안됩니다. 동네마다 사람마다 억양과 발음이 달라서요
20/06/03 11:56
분량이 올마나 되는지는 모르겠지만
https://cloud.google.com/speech-to-text?hl=ko 구글 음성인식기 api 입니다. 무료로 사용할 수 있는 부분도 있는 것 같아요. STT 고 MT 고 도메인 한정할수록 성능이 높아지는데, 제너럴 도메인에서 성능 제일 잘 내고 있는 것 중 하나는 단연 구글이죠
20/06/03 12:17
국산 프로그램 vrew가 쓰기 편하고 무난합니다. 아예 텍스트파일로만 저장 가능하고 자막파일로도 가능하고 무료입니다.
그런데 발화자의 발음이나 속도 등등에 따라서 당연히 정확도는 천차만별입니다. 문장 부호도 지원 안 되고 ^^;; 정확한 작업을 위해서는 보통은 vrew로 추출하고 다시 영상 보면서 추출된 텍스트 수정하고 띄어쓰기 수정하고 텍스트 완성한 후 다시 싱크를 찍는 작업이 필요합니다만 예전에 쌩으로 들으면서 타이핑하는 것보다는 수월하긴 합니다. 물론 발화자의 상태에 따라서 그냥 쌩으로 하는 게 속도가 빠를 때도 있습니다. 예전에는 60분 이상 되는 영상들은 종종 오류나고 그랬는데 요즘은 100분 근처까지 문제 없이 잘 되더군요.
20/06/03 12:52
딱 말씀하신 그런 기능을 제공하는 프로그램이 vrew입니다. AI 수준에 대한 기대치는 각자 다르다고 하더라도 전체적인 방향은 일치하네요.,
|