tf读取数据pai

更新时间：2021-10-09 03:54:04

import argparse
import tensorflow as tf
import os
FLAGS=None
def main(_):
dirname = os.path.join(FLAGS.buckets, "csvtest.csv")
reader=tf.TextLineReader()
filename_queue=tf.train.string_input_producer([dirname])
key,value=reader.read(filename_queue)
record_defaults=[[''],[''],[''],[''],['']]
d1, d2, d3, d4, d5= tf.decode_csv(value, record_defaults, ',')
init=tf.initialize_all_variables()
with tf.Session() as sess:
sess.run(init)
coord = tf.train.Coordinator()
threads = tf.train.start_queue_runners(sess=sess,coord=coord)
for i in range(4):
print(sess.run(d2))
coord.request_stop()
coord.join(threads)
if __name__ == '__main__':
parser = argparse.ArgumentParser()
parser.add_argument('--buckets', type=str, default='',
help='input data path')
parser.add_argument('--checkpointDir', type=str, default='',
help='output model path')
FLAGS, _ = parser.parse_known_args()
tf.app.run(main=main)

dirname:OSS文件路径，可以是数组，方便下一阶段shuffle
reader：TF内置各种reader API，可以根据需求选用
tf.train.string_input_producer：将文件生成队列
tf.decode_csv：是一个splite功能的OP，可以拿到每一行的特定参数
通过OP获取数据，在session中需要tf.train.Coordinator()和tf.train.start_queue_runners(sess=sess,coord=coord)

在代码中，我们的输入是3行5个字段：

1,1,1,1,1
2,2,2,2,2
3,3,3,3,3

我们循环输出4次，打印出第2个字段。结果如图：

tf读取数据pai

输出结果也证明了数据结构是成队列。

上一篇 : ：Keras上的VGGNet、ResNet、Inception与Xception下一篇 : Tensorflow加载预训练模型和保存模型

相关阅读

推荐文章