北邮人智-音频感知技术团队
用户8758
添加快捷方式
分享
48词新+维语+哈语
输入“/”快速插入内容
48词新+维语+哈语
用户8758
用户8758
2024年7月21日修改
数据说明
数据来源
数据一:48词新
汉语48词数据和负例数据,共904956条,包括:
1.
48词数据第一次录制
2.
48词数据第二次录制
3.
使用48词数据第一次录制的数据训练的模型解码10000h数据得到的FA
4.
其它实现场景的录制数据截取1s一段得到音频
路径:/work105/duwenqiang/resrearch/zeus_kws.fyt/resource.fyt.48ci.double.20240716/
数据二:维吾尔语
175个说话人,9个关键词的维语数据,共23418条。
随机抽取165人的数据用于训练,10人的数据用于测试。用于训练的部分,经过数据增强,扩增7倍,为155750条数据,方式包括babble, music, noise, reverb, speed 0.9, speed 1.1。用于测试的部分为1168条。
路径(原始数据):/work105/weiyang/project/fyt/data/10.minority.language/uyghur/wav.scp
数据三:哈萨克语
152个说话人,9个关键词的哈语数据,共19006条。
随机抽取142人的数据用于训练,10人的数据用于测试。用于训练的部分,经过数据增强,扩增7倍,为121261条,方式包括babble, music, noise, reverb, speed 0.9, speed 1.1。用于测试的部分为1683条。
路径(原始数据):/work105/weiyang/project/fyt/data/10.minority.language/kazakh/wav.scp
训练数据
resource.fyt.48ci.zh-ug-kk.20240716
48词新
+ 维语数据中的训练数据
+ 哈语数据中的训练数据
合并的数据中,随机抽取8000条数据作为验证集,剩余1173967条数据作为训练集。
路径:/work105/weiyang/project/fyt/zeus_kws/resource.fyt.48ci.zh-ug-kk.20240716/valid.list
/work105/weiyang/project/fyt/zeus_kws/resource.fyt.48ci.zh-ug-kk.20240716/train.list
测试数据
test.7ci.clean
7个关键词,共1036条汉语数据。
路径:/work105/duwenqiang/resrearch/zeus_kws.fyt/fyt.onnx.48ci/test.48ci.weiyu/test.7ci.clean.scp
test.7ci.noise
在常州分公司,7名同事录制7个关键词的测试集
路径:/work105/duwenqiang/resrearch/zeus_kws.fyt/fyt.onnx.48ci/testset/test.7ci.noise.scp
test.caiji_zh20_mild_accent_20240705
/work105/duwenqiang/DATA/fenyinta/TEST/test.20ci/test.caiji_zh20_mild_accent_20240705.scp
test.caiji_zh20_mild_accent_20240721
/work105/duwenqiang/resrearch/zeus_kws.fyt/fyt.onnx.48ci/
test.48ci.double.cn
.2minnanyu.2weiyu/test.caiji_zh20_mild_accent_20240721.scp
test.48ci.clean
[待解释]
路径:/work105/duwenqiang/resrearch/zeus_kws.fyt/fyt.onnx.48ci/testset/test.48ci.clean.scp
uyghur_test
维语数据中的1168条测试数据。
路径:/work105/weiyang/project/fyt/data/10.minority.language/uyghur/test/wav.scp
hazkakh_test
哈语数据中的1683条测试数据。
路径:/work105/weiyang/project/fyt/data/10.minority.language/kazakh/test/wav.scp
FA.test1
实际场景下宿舍,和厕所实际录音 + 会议室录,约110000句
路径:/work105/duwenqiang/resrearch/zeus_kws.fyt/fyt.onnx.48ci/testset/fa.noise.RSA.TSA.scp.meeting.20240318.segment.scp