type
status
date
slug
summary
tags
icon
password
😀
学习了Pytorch的最初的内容,记录一下Pytorch第一部分内容—Dataset的内容,参考来自我是土堆的教学(感谢orz!!

一、Dataset是干什么的?

Dataset其实是一个类,可以提取我们需要的数据。先给每一个数据一个编号(idx),我们使用一个子类来继承Dataset类,初始化Dataset子类实例后,就可以通过这个编号去实例对象中读取相应的数据,会自动调用__getitem__方法,同时子类对象也会获取相应真实的Label(人为去复写即可)。

二、我们需要知道的一些模块作用和一些Python函数

1、torch.utils.data

是加载数据的核心,返回可迭代的数据。只要是用PyTorch来训练模型基本都会用到该接口。Dataset就在这个里面。

2、PIL

全称为:Python Imaging Library
是一个强大的图像处理标准库。我们所用到的图像处理Image会在这个里面。

3、os

全称为:operating system
os模块提供了各种Python程序与操作系统进行交互的接口。通过使用os模块,可以方便的与操作系统进行交互。
在进行txt文件读写的时候会用到。

三、Dataset代码类实战

可以查看Dataset的官方文档。在命令行里面导入Dataset之后输入help(Dataset)
notion image
在Dataset类里面常用__getitem____len__两个办法(def)。
__getitem__:要返回两个值一个是图像img,另一个是图像的标签label
__len__:要返回的值是当前数据集的长度
 
如何进行文件的快速label继承和多态
Loading...
JucanaYu
JucanaYu
干饭人,干饭魂🍚
最新发布
Python练习-类型转换
2025-4-9
Python练习-count、remove、append、extend
2025-4-8
Python练习-set和sorted
2025-4-6
Python练习-insert和del
2025-4-6
Python练习-range
2025-4-6
Python练习-双指针法
2025-4-6