资 源 简 介
要读取 PTB 数据集需要用到 reader.py,在 GitHub 上面有源码,可以下载或者直接复制下来。reader.py 提供了两个函数用于读取和处理 PTB 数据集:
ptb_raw_data(DATA_PATH):读取原始数据
ptb_producer(raw_data,batch_size,num_steps):用于将数据组织成大小为 batch_size,长度为 num_steps 的数据组
原书中的代码没有将这两个函数的操作对象视为 tensor,而根据 reader.py 中的源码说明,它是对 tensor 进行操作的。并且 ptb_producer() 函数中使用了 tf.train.range_input_producer() 函数,所以需要开启多线程。
以下代码示范了如何使用这两个函数:
————————————————
版权声明:本文为CSDN博主「widiot0x」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/White_Idiot/article/details/78881261