ToB企服应用市场:ToB评测及商务社交产业平台

标题: 【人工智能学习笔记】2_数据处理底子 [打印本页]

作者: 水军大提督    时间: 2024-9-12 03:48
标题: 【人工智能学习笔记】2_数据处理底子
数据的概述

数据(Data)的定义


在计算机科学与技术范畴中,数据是指齐备可以或许输入计算机中,且能被计算机程序所处理的符号的总称
数据类别


数据收罗

数据可视化

借助于图形化手段对数据加以表明

绘图方法
  1. plt.hist(x, bins=10)#直方图
  2. #x是一维数组
  3. #bins代表直方图中的箱子数量,默认是10
  4. plt.hist(x, y)#折线图
  5. #数据可以列表或数组
  6. plt.scatter(x, y)#散点图
  7. #x,y表示长度相同的数组
  8. plt.pie(x,explode=None,labels=None)#饼状图
  9. #x:表示每个扇形的面积
  10. #explode:表示各个扇形之间的间隔
  11. #Labels:列表,各个扇形的标签
复制代码
箱线图
用作显示一组数据分散情况资料的统计图
能显示出一组数据的最大值、最小值、中位数、及上下四分位数
  1. plt.boxplot(x, labels=None)
  2. #x:表示每个需要绘制的数据
  3. #Labels:列表,箱型线的标签
复制代码

数据标注

数据标注概述及紧张性

概念:通过分类、画框、标注等对语音、图片、文本数据举行处理。提高练习的正确度
标注分类:语音标注、图片标注、文本标注等
具体方法:通过画框描点等方法对数据打标签,给后续处理提供练习信息
应用场景:语音辨认、无人驾驶、证件辨认等场景
紧张性:正确性、数量影响数据集的质量
多范例数据的标注方法及标准



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4