Independent Hindi ASR Benchmark

60dB delivers the lowest
Word Error Rate on Hindi

Across 9,997 Hindi clips and 122,747 reference words spanning read, synthetic, conversational and noisy speech, 60dB achieves the lowest overall WER — and ranks #1 on real-world conversational Hindi, winning 4 of 6 datasets.

Generated 2026-05-31 · Lower WER is better

12.95%

Lowest overall WER

4 / 6

Datasets won

9,997

Hindi clips evaluated

Public datasets

Overall ranking

Overall — primary ranking

Five datasets (FLEURS excluded for fairness)

#	Provider	WER	Accuracy
🥇	60dB (HTTP / batch)Us	12.95%	87.05%
🥈	Ringg AI	14.92%	85.08%
🥉	60dB (WebSocket / streaming)Us	15.65%	84.35%
4	ElevenLabs	15.74%	84.26%
5	Deepgram	20.69%	79.31%
6	Sarvam AI	22.16%	77.84%

Overall — all six datasets

Including FLEURS

#	Provider	WER	Accuracy
🥇	60dB (HTTP / batch)Us	12.96%	87.04%
🥈	60dB (WebSocket / streaming)Us	15.49%	84.51%
🥉	Ringg AI	15.82%	84.18%
4	ElevenLabs	16.66%	83.34%
5	Deepgram	21.46%	78.54%
6	Sarvam AI	23.16%	76.84%

Why two tables? The FLEURS subset's pre-computed vendor columns contain data-quality artifacts (invalid-word placeholders) that inflate competitor error rates, so our primary ranking excludes it for fairness. 60dB leads both ways.

Results by dataset

Six public Hindi datasets covering read speech, synthetic audio, and conversational speech with and without noise.

Common Voice

Read speech

1,727 clips

#	Provider	WER
🥇	ElevenLabs	15.23%
🥈	Ringg AI	16.01%
🥉	60dB (HTTP / batch)Us	17.72%
4	60dB (WebSocket / streaming)Us	20.21%
5	Deepgram	21.56%
6	Sarvam AI	23.21%

FLEURS

Read speech

417 clips

#	Provider	WER
🥇	60dB (HTTP / batch)Us	13.09%
🥈	60dB (WebSocket / streaming)Us	13.72%
🥉	Ringg AI	25.62%
4	ElevenLabs	26.79%
5	Deepgram	29.91%
6	Sarvam AI	34.19%

IndicTTS

Synthetic

98 clips

#	Provider	WER
🥇	60dB (HTTP / batch)Us	11.51%
🥈	Ringg AI	11.83%
🥉	60dB (WebSocket / streaming)Us	11.87%
4	ElevenLabs	13.87%
5	Deepgram	15.16%
6	Sarvam AI	23.92%

Kathbath

Conversational

1,929 clips

#	Provider	WER
🥇	60dB (HTTP / batch)Us	12.83%
🥈	Ringg AI	13.08%
🥉	60dB (WebSocket / streaming)Us	15.20%
4	ElevenLabs	15.56%
5	Deepgram	17.80%
6	Sarvam AI	23.01%

Kathbath-noisy

Conversational + noise

1,929 clips

#	Provider	WER
🥇	60dB (HTTP / batch)Us	14.14%
🥈	Ringg AI	14.39%
🥉	ElevenLabs	15.38%
4	60dB (WebSocket / streaming)Us	16.43%
5	Deepgram	19.04%
6	Sarvam AI	23.74%

MUCS