type
status
date
slug
summary
tags
icon
password
学习了Pytorch的最初的内容,记录一下Pytorch第一部分内容—Dataset的内容,参考来自我是土堆的教学(感谢orz!!
一、Dataset是干什么的?
Dataset其实是一个类,可以提取我们需要的数据。先给每一个数据一个编号(idx),我们使用一个子类来继承Dataset类,初始化Dataset子类实例后,就可以通过这个编号去实例对象中读取相应的数据,会自动调用__getitem__方法,同时子类对象也会获取相应真实的Label(人为去复写即可)。
二、我们需要知道的一些模块作用和一些Python函数
1、torch.utils.data
是加载数据的核心,返回可迭代的数据。只要是用PyTorch来训练模型基本都会用到该接口。Dataset就在这个里面。
2、PIL
全称为:Python Imaging Library
是一个强大的图像处理标准库。我们所用到的图像处理Image会在这个里面。
3、os
全称为:operating system
os模块提供了各种Python程序与操作系统进行交互的接口。通过使用os模块,可以方便的与操作系统进行交互。
在进行txt文件读写的时候会用到。
三、Dataset代码类实战
可以查看Dataset的官方文档。在命令行里面导入Dataset之后输入help(Dataset)

在Dataset类里面常用
__getitem__
和__len__
两个办法(def)。__getitem__
:要返回两个值一个是图像img,另一个是图像的标签label__len__
:要返回的值是当前数据集的长度- 作者:JucanaYu
- 链接:https://jucanayu.top/article/91b8df18-167f-452a-98cf-8e7028786437
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。