qidao123.com技术社区-IT企服评测·应用市场

标题: 呆板学习实操 第二部门 神经网路和深度学习 第13章 使用TensorFlow加载和预处理数据 [打印本页]

作者: 卖不甜枣    时间: 2025-5-10 11:20
标题: 呆板学习实操 第二部门 神经网路和深度学习 第13章 使用TensorFlow加载和预处理数据
呆板学习实操 第二部门 神经网路和深度学习 第13章 使用TensorFlow加载和预处理数据

内容概要

第13章深入探究了怎样使用TensorFlow加载和预处理数据。本章首先介绍了tf.data API,它能够高效地加载和预处理大规模数据集,支持并行文件读取、数据打乱、批量处理等功能。接着,讨论了TFRecord格式,这是一种高效的二进制存储格式,适合存储大量数据。别的,还介绍了Keras预处理层,这些层可以直接嵌入到模型中,实现在练习和推理过程中对数据的主动预处理。最后,探究了TensorFlow Datasets(TFDS)和TensorFlow Hub等工具,它们提供了便捷的数据加载和预处理功能。

主要内容

关键代码和算法

13.1 使用tf.data API创建数据集

  1. import tensorflow as tf
  2. # 创建数据集
  3. X = tf.range(10)
  4. dataset = tf.data.Dataset.from_tensor_slices(X)
  5. # 数据转换
  6. dataset = dataset.repeat(3).batch(7)
  7. # 使用map()进行预处理
  8. dataset = dataset.map(lambda x: x * 2)
  9. # 数据打乱和批量处理
  10. dataset = dataset.shuffle(buffer_size=4).batch(32).prefetch(1)
复制代码
13.2 创建TFRecord文件并读取

  1. # 写入TFRecord文件
  2. with tf.io.TFRecordWriter("my_data.tfrecord") as f:
  3.     f.write(b"This is the first record")
  4.     f.write(b"And this is the second record")
  5. # 读取TFRecord文件
  6. dataset = tf.data.TFRecordDataset(["my_data.tfrecord"])
  7. for item in dataset:
  8.     print(item)
复制代码
13.3 使用Keras预处理层

  1. # 归一化层
  2. norm_layer = tf.keras.layers.Normalization()
  3. norm_layer.adapt(X_train)
  4. model = tf.keras.models.Sequential([norm_layer, tf.keras.layers.Dense(1)])
  5. # 分类特征编码
  6. str_lookup_layer = tf.keras.layers.StringLookup()
  7. str_lookup_layer.adapt(cities)
  8. cat_embeddings = tf.keras.layers.Embedding(input_dim=str_lookup_layer.vocabulary_size(), output_dim=2)
  9. lookup_and_embed = tf.keras.Sequential([str_lookup_layer, cat_embeddings])
  10. # 文本向量化
  11. text_vec_layer = tf.keras.layers.TextVectorization()
  12. text_vec_layer.adapt(train_data)
复制代码
精彩语录

总结

通过本章的学习,读者将把握使用TensorFlow加载和预处理数据的方法。内容涵盖了tf.data API的使用、TFRecord格式的读写、Keras预处理层的应用,以及TensorFlow Datasets和TensorFlow Hub的使用。这些技能对于高效处理大规模数据集、优化模型练习过程以及简化模型摆设具有告急意义。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/) Powered by Discuz! X3.4