一、音频数据
二、文本数据
1. CLUECorpus2020:可能是史上最大的开源中文语料库以及高质量中文预训练模型集合
语音识别-重要开源数据
原文:https://www.cnblogs.com/tibetanmastiff/p/12555582.html