QueueDataset
- class
QueueDataset
[源代码]
代码示例:
local_shuffle
()
局域shuffle数据
QueueDataset中不支持局域shuffle,可能抛出NotImplementedError
代码示例:
- import paddle.fluid as fluid
- dataset = fluid.DatasetFactory().create_dataset("QueueDataset")
- dataset.local_shuffle()
global_shuffle
(fleet=None)
全局shuffle数据
QueueDataset中不支持全局shuffle,可能抛出NotImplementedError
代码示例:
- import paddle.fluid as fluid
- from paddle.fluid.incubate.fleet.parameter_server.pslib import fleet
- dataset = fluid.DatasetFactory().create_dataset("QueueDataset")
- dataset.global_shuffle(fleet)
desc
()
代码示例:
- import paddle.fluid as fluid
- dataset = fluid.DatasetFactory().create_dataset()
- print(dataset.desc())
返回:一个字符串信息
set_batch_size
(batch_size)
设置batch size。在训练期间生效。
代码示例:
- 参数:
- batch_size (int) - batch size
set_fea_eval
(record_candidate_size, fea_eval)
- 参数:
代码示例:
- import paddle.fluid as fluid
- dataset = fluid.DatasetFactory().create_dataset(“InMemoryDataset”)
- dataset.set_fea_eval(1000000, True)
set_filelist
(filelist)
在当前的worker中设置文件列表。
代码示例:
- import paddle.fluid as fluid
- dataset = fluid.DatasetFactory().create_dataset()
- dataset.set_filelist(["a.txt", "b.txt"])
- 参数:
- filelist (list) - 文件列表
set_hdfs_config
(fs_name, fs_ugi)
代码示例:
- import paddle.fluid as fluid
- dataset = fluid.DatasetFactory().create_dataset()
- dataset.set_hdfs_config("my_fs_name", "my_fs_ugi")
- 参数:
- fs_name (str) - fs名称
- fs_ugi (str) - fs ugi
- (pipe_coommand)
在当前的 dataset
中设置pipe命令。pipe命令只能使用UNIX的pipe命令
代码示例:
- 参数:
set_thread
(thread_num)
设置进程数量,等于readers的数量。
代码示例:
- import paddle.fluid as fluid
- dataset = fluid.DatasetFactory().create_dataset()
- dataset.set_thread(12)
- 参数:
- thread_num (int) - 进程数量
set_use_var
(var_list)
设置将要使用的 Variable
。
代码示例:
- import paddle.fluid as fluid
- dataset = fluid.DatasetFactory().create_dataset()
- dataset.set_use_var([data, label])
- 参数:
- var_list (list) - variable 列表
- (slots)
- 参数:
- slots (list[string]) - 要打乱特征的集合
代码示例:
- import paddle.fluid as fluid
- dataset = fluid.DatasetFactory().create_dataset(“InMemoryDataset”)
- dataset.set_merge_by_lineid()
- #支持slot 0
- dataset.slots_shuffle([‘0’])