ToB企服应用市场:ToB评测及商务社交产业平台

标题: 《呆板学习》——数据标准化(0~1标准化,z标准化) [打印本页]

作者: 王國慶    时间: 2025-1-3 14:58
标题: 《呆板学习》——数据标准化(0~1标准化,z标准化)
数据标准化

一、什么是标准化


二、常用标准化

0~1标准化


   公式中x为原始数据,min(x)为一组特性值的最小值,max(x)为最大值。

0~1标准化的范围就像它的名字一样在[0-1]的范围。
  在python中,可以使用sklearn.preprocessing.MinMaxScaler类来实现0~1标准化
例子:
  1. import numpy as np
  2. from sklearn.preprocessing import MinMaxScaler
  3. # 创建一个包含随机数值的二维数组,模拟特征数据集
  4. # 假设有5个样本,每个样本有3个特征
  5. np.random.seed(0)  # 抛出一个随机种子,为了让后面每次运行时生成的随机数值,都与第一次相同
  6. data = np.random.rand(5, 3) * 10  # 生成一个5x3的数组,每个元素的值在0到10之间
  7. print("原始数据:")
  8. print(data)
  9. # 使用MinMaxScaler进行归一化
  10. min_max_scaler = MinMaxScaler()
  11. data_min_max = min_max_scaler.fit_transform(data)
  12. print("\nMinMaxScaler归一化后的数据:")
  13. print(data_min_max)
  14. """
  15. 原始数据:
  16. [[5.45374108 6.36285388 6.89790337]
  17. [4.22031847 9.29446541 1.72869836]
  18. [6.29878395 8.68105164 8.78970701]
  19. [7.65555541 3.81574752 1.61238819]
  20. [9.50247279 8.58981375 9.87706441]]
  21. MinMaxScaler归一化后的数据:
  22. [[0.23350749 0.4649092  0.63953082]
  23. [0.         1.         0.01407317]
  24. [0.39348822 0.88803699 0.86843315]
  25. [0.65034771 0.         0.        ]
  26. [1.         0.87138384 1.        ]]
  27. """
复制代码
z标准化


   
  
   
  
  1. import numpy as np
  2. from sklearn.preprocessing import StandardScaler
  3. # 创建一个包含随机数值的二维数组,模拟特征数据集
  4. # 假设有5个样本,每个样本有3个特征
  5. np.random.seed(0)  # 抛出一个随机种子,为了让后面每次运行时生成的随机数值,都与第一次相同
  6. data = np.random.rand(5, 3) * 10  # 生成一个5x3的数组,每个元素的值在0到10之间
  7. print("原始数据:")
  8. print(data)
  9. # 使用StandardScaler进行标准化
  10. scaler_Z = StandardScaler()
  11. data_scaled = scaler_Z.fit_transform(data)
  12. print("\nStandardScaler标准化后的数据:")
  13. print(data_scaled)
  14. """
  15. 原始数据:
  16. [[2.91800254 3.2360031  9.66065598]
  17. [7.47746281 4.00855141 2.03950532]
  18. [9.8433753  8.32004568 4.55501016]
  19. [6.00990907 9.91191497 4.61528516]
  20. [0.15924446 1.95696181 6.33065699]]
  21. StandardScaler标准化后的数据:
  22. [[-0.69405259 -0.73160863  1.67789759]
  23. [ 0.64479923 -0.48048456 -1.35200705]
  24. [ 1.33953196  0.92100707 -0.35192975]
  25. [ 0.21386292  1.43845911 -0.3279665 ]
  26. [-1.50414152 -1.14737299  0.35400572]]
  27. """
复制代码
三、注意事项



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4