模型微调‌ 干货！深入学习必学的模型微调

3,040 0 0

学习目标

1.微调

如何在只有6万张图像的MNIST训练数据集上训练模型。学术界当下使用最广泛的大规模图像数据集，它有超过1,000万的图像和1,000类的物体。然而，我们平常接触到数据集的规模通常在这两者之间。假设我们想从图像中识别出不同种类的椅子，然后将购买链接推荐给用户。一种可能的方法是先找出100种常见的椅子，为每种椅子拍摄1,000张不同角度的图像，然后在收集到的图像数据集上训练一个分类模型。另外一种解决办法是应用迁移学习（），将从源数据集学到的知识迁移到目标数据集上。例如，虽然数据集的图像大多跟椅子无关，但在该数据集上训练的模型可以抽取较通用的图像特征，从而能够帮助识别边缘、纹理、形状和物体组成等。这些类似的特征对于识别椅子也可能同样有效。

微调由以下4步构成。

在源数据集（如数据集）上预训练一个神经网络模型，即源模型。创建一个新的神经网络模型，即目标模型。它复制了源模型上除了输出层外的所有模型设计及其参数。我们假设这些模型参数包含了源数据集上学习到的知识，且这些知识同样适用于目标数据集。我们还假设源模型的输出层跟源数据集的标签紧密相关，因此在目标模型中不予采用。为目标模型添加一个输出大小为目标数据集类别个数的输出层，并随机初始化该层的模型参数。在目标数据集（如椅子数据集）上训练目标模型。我们将从头训练输出层，而其余层的参数都是基于源模型的参数微调得到的。

模型微调‌ 干货！深入学习必学的模型微调

当目标数据集远小于源数据集时，微调有助于提升模型的泛化能力。

2.热狗识别

接下来我们来实践一个具体的例子：热狗识别。将基于一个小数据集对在数据集上训练好的模型进行微调。该小数据集含有数千张热狗或者其他事物的图像。我们将使用微调得到的模型来识别一张图像中是否包含热狗。

首先，导入实验所需的工具包。

import tensorflow as tf
import numpy as np

2.1 获取数据集

模型微调‌ 干货！深入学习必学的模型微调

我们首先将数据集放在路径/data之下:

每个类别文件夹里面是图像文件。

上一节中我们介绍了进行图像增强，我们可以

323AI导航网发布

# 默认分类 # 图像识别 # 数据集 # 模型微调 # 神经网络 # 迁移学习

文章版权归作者所有，未经允许请勿转载。

ai人工智能什么软件好用要取代程序员？人工智能给软件开发带来了什么

admin

3,558 0

ai创建文字的方式有几种百度OCR（文字识别）服务使用入坑指南

admin

101 0

模型微调‌ 预训练模型微调-详解洞察

admin

3,045 0

323ai导航网发布：一张图片解释数据合成

wangzhan

693 22

ai文字助手软件知道怎么便捷的进行文本转换吗？这些文字识别器帮你实现

admin

92 0

大型语言模型有助于解读临床记录

wangzhan

4,094 11

暂无评论

暂无评论...

模型微调‌ 干货！深入学习必学的模型微调

AI写作生成器‌ 这6款AI写作一键生成工具，让你未来的写作之路，创意无限！

AI写作生成器‌ 强烈推荐6个AI写作生成器工具（建议收藏）

相关文章

暂无评论