泉源类型 | 推荐 |
公开的数据平台 | 魔搭社区内开放了近3000个数据集,涉及文本、图像、音频、视频和多模态等多种场景,左侧有标签栏帮助快速导览,大家可以看看有没有本身必要的数据集。![]() 其他数据平台推荐:
|
利用API或爬虫获取 |
|
数据合成 | 利用现有的图形引擎(如Unity、Unreal Engine)或特定软件生成合成数据,这在训练某些类型的模型时非常有用。 近来Datawhale联合阿里云天池,做了一整套多模态大模型数据合成的学习,欢迎大家一起交换。从零入门多模态大模型数据合成 |
数据加强 | 对于较小的数据集,可以通过旋转、翻转、缩放、颜色变动等方式进行数据加强。 |
购买或定制 | 假如你的应用是特定范畴的,比如医学影像、卫星图像等,发起从靠谱的渠道购买一些数据集。 |
欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/) | Powered by Discuz! X3.4 |