如何创建音频数据集并上传至huggingface

作者: b_walking | 来源:发表于2025-10-28 15:35 被阅读0次

第二篇:创建spring cloud 整体聚合父工程projec
node接口解析formdata数据
mysql
GEO数据上传
Mysql的培训文档
创建tfrecord并读取数据集
Linux下 MySQL二进制版本安装
MySQL —— 数据库&数据表&表字段与数据管理（常用指令）
【iOS性能监控】- FPS
sqoop 1.99.7 导入导出数据

创建数据集

目录结构

hfdataset/
└── train/
    └── metadata.jsonl
    └── sdsdyk.wav
    └── ylfbnqsds.wav
└── test/
    └── metadata.jsonl
    └── sdsdyk.wav
    └── ylfbnqsds.wav

metadata.jsonl内容格式

{"file_name": "sdsdyk.wav", "sentence": "圣灯山的游客"}
{"file_name": "ylfbnqsds.wav", "sentence": "巴南区圣灯山"}

上传数据集

以命令行的方式上传数据集

进入hfdataset目录，登录huggingface

PS D:\software\hfdataset> huggingface-cli login

执行上传命令

PS D:\software\hfdataset> hf upload my-cool-dataset . . --repo-type dataset

my-cool-dataset为自己的数据集名称，没有的话会自动创建，有的话会替换内容。

备注说明

值得注意的是，一些命令已被弃用，但文档中并非更新，执行时如报一警告错误，例如在huggingface中创建空数据集文档(my-cool-dataset)的命令：

huggingface-cli repo create my-cool-dataset --type dataset

首先，huggingface-cli已被弃用，需改为hf。其次，hf识别不到--type这个参数，去掉即可，修改后的命令如下：

hf repo create my-cool-dataset

参考文章：

网友评论

本文标题：如何创建音频数据集并上传至huggingface

本文链接：https://www.haomeiwen.com/subject/vnguxstx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

如何创建音频数据集并上传至huggingface

创建数据集

目录结构

metadata.jsonl内容格式

上传数据集

备注说明

参考文章：

相关文章

第二篇:创建spring cloud 整体聚合父工程projec

node接口解析formdata数据

mysql

GEO数据上传

Mysql的培训文档

创建tfrecord并读取数据集

Linux下 MySQL二进制版本安装

MySQL —— 数据库&数据表&表字段与数据管理（常用指令）

【iOS性能监控】- FPS

sqoop 1.99.7 导入导出数据

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读