The VOiCES Corpus

Dataset from https://iqtlabs.github.io/voices/

Download

datasets add voices

Description

The Voices Obscured in Complex Environmental Settings (VOiCES) corpus is a creative commons speech dataset targeting acoustically challenging and reverberant environments with robust labels and truth data for transcription, denoising, and speaker identification.

Licence

CC BY 4.0

Variants

competition: Competition subset

datasets add voices@competition

full: Full subset

datasets add voices@full

Everything is in Public Domain