AI Skill Hub 强烈推荐:Awesome-Korean-Speech-Recognition — AI 语音识别工具中文文档 是一款优质的AI工具。AI 综合评分 8.2 分,在同类工具中表现稳健。如果你正在寻找可靠的AI工具解决方案,这是一个值得深入了解的选择。
Awesome-Korean-Speech-Recognition — AI 语音识别工具中文文档 是一款基于 Python 开发的开源工具,专注于 awesome、korean、speech-recognition 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
Awesome-Korean-Speech-Recognition — AI 语音识别工具中文文档 是一款基于 Python 开发的开源工具,专注于 awesome、korean、speech-recognition 等核心功能。作为 GitHub 开源项目,它拥有活跃的社区支持和持续的版本迭代,代码完全透明可审计,支持本地部署以保护数据隐私。无论是个人使用还是集成到企业工作流,都能提供稳定可靠的解决方案。
# 克隆仓库 git clone https://github.com/rtzr/Awesome-Korean-Speech-Recognition cd Awesome-Korean-Speech-Recognition # 查看安装说明 cat README.md # 按 README 完成环境依赖安装后即可使用
# 查看帮助 awesome-korean-speech-recognition --help # 基本运行 awesome-korean-speech-recognition [options] <input> # 详细使用说明请查阅文档 # https://github.com/rtzr/Awesome-Korean-Speech-Recognition
# awesome-korean-speech-recognition 配置说明 # 查看配置选项 awesome-korean-speech-recognition --config-example > config.yml # 常见配置项 # output_dir: ./output # log_level: info # workers: 4 # 环境变量(覆盖配置文件) export AWESOME_KOREAN_SPEECH_RECOGNITION_CONFIG="/path/to/config.yml"
A curated list of Korean speech recognition resources for developers, including the error rate (Character Error Rate) of Speech Recognition API on public datasets.
한국어 음성인식을 사용해볼 수 있는 개발자 사이트의 API로 AI-Hub에서 공개한 다양한 테스트셋의 에러율(Character Error Rate) 을 음성인식 API별로 측정한 리포지토리입니다. 본 리포지토리는 다음과 같은 내용을 다루고 있습니다.
---
API로 음성인식을 바로 사용해 볼 수 있는 개발자 사이트입니다. 별도의 승인 절차나 영업 컨택 없이 바로 사용해볼 수 있는 사이트를 주로 나열해두었습니다.
아래는 이번에 다루지 못했지만 크레딧이 주어지는 경우 추후에 테스트 해볼 예정입니다.
---
평가된 각 음성인식 API의 세부 정보와 CER 측정 결과입니다.
비용과 시간 관계상 테스트셋 별로 3000개의 문장을 샘플링하여 테스트를 진행하였습니다.
3000개에 대한 데이터셋 정보는 여기에서 확인하실 수 있습니다.
테이블 내의 숫자는 작을수록 에러가 적다는 의미입니다.
| API \ 데이터셋 | Avg. CER(%) | 주요 영역별 회의 | 회의 | 상담 | 저음질<br/>전화망 | 한국어<br/>강의 | KsponSpeech eval clean | KsponSpeech eval other |
|---|---|---|---|---|---|---|---|---|
| OpenAI Whisper | 11.39 | 10.49 | 10.16 | 7.51 | 17.27 | 10.89 | 12.06 | 11.34 |
| Google <br> api v2 | 11.50 | N/A[^1] | 11.62 | 8.37 | 14.11 | 11.48 | 11.82 | 11.59 |
| Deepgram(nova-2) | 21.02 | 12.02 | 17.8 | 20.68 | 30.47 | 21.48 | 23.48 | 21.18 |
| Azure batch STT | 10.88 | 18.19 | 9.95 | 7.8 | 9.87 | 10.5 | 10.26 | 9.56 |
| AWS Transcribe | 11.11 | 25.98 | 9.65 | 7.78 | 7.59 | 9.33 | 8.58 | 8.89 |
| Gemini 2.0 flash | 16.58 | 32.34 | 11.98 | 8.81 | 16.09 | 10.65 | 18.41 | 14.48 |
| ETRI | 10.19 | 9.95 | 10.56 | 8.36 | 15.46 | 9.89 | 9.99 | 7.15 |
| Naver ClovaSpeech | 7.52 | 8.38 | 7.63 | 4.91 | 6.49 | **7.08** | 8.05 | 7.96 |
| 리턴제로 | **5.91** | **5.98** | **6.74** | **3.51** | 4.40 | 7.35 | **6.64** | **6.77** |
| 리턴제로 Whisper[^2] | 6.59 | 6.84 | 8.33 | 4.1 | **4.26** | 7.11 | 7.78 | 7.73 |
[^1]: Google의 음성인식 파일 크기의 제한으로 생략 Request audio can be a maximum of 10485760 bytes, Audio can be of a a maximum of 60 seconds.
[^2]: OpenAI에서 공개한 Whisper 오픈소스 모델에 리턴제로의 데이터를 파인튜닝(fine-tuning)한 모델입니다.
---
AI Skill Hub 为第三方内容聚合平台,本页面信息基于公开数据整理,不对工具功能和质量作任何法律背书。
建议在沙箱或测试环境中充分验证后,再部署至生产环境,并做好必要的安全评估。
✅ CC0 1.0 — 公共领域贡献,完全放弃版权,无任何使用限制。
总体来看,Awesome-Korean-Speech-Recognition — AI 语音识别工具中文文档 是一款质量优秀的AI工具,在同类工具中具备一定竞争力。AI Skill Hub 将持续追踪其更新动态,建议收藏备用,结合自身场景选择合适时机引入使用。
| 原始名称 | Awesome-Korean-Speech-Recognition |
| 原始描述 | 한국어 음성인식 STT API 리스트. 각 성능 벤치마크. |
| Topics | awesomekoreanspeech-recognitionspeech-to-textspeech-to-text-apiwhisperstt |
| GitHub | https://github.com/rtzr/Awesome-Korean-Speech-Recognition |
| License | CC0-1.0 |
收录时间:2026-05-22 · 更新时间:2026-05-22 · License:CC0-1.0 · AI Skill Hub 不对第三方内容的准确性作法律背书。