大数据深度学习卷积神经网络CNN：CNN结构、训练与优化一文全解

文章目录

大数据深度学习卷积神经网络CNN：CNN结构、训练与优化一文全解
一、引言
- 1.1 背景和重要性
- 1.2 卷积神经网络概述
二、卷积神经网络层介绍
三、训练与优化
- 3.1 训练集准备与增强
3.2 损失函数
3.3 优化器
3.4 学习率调整
3.5 正则化技巧
3.6 模型评估与调优
4. 总结

大数据深度学习卷积神经网络CNN：CNN结构、训练与优化一文全解

本文全面探讨了卷积神经网络CNN，深入分析了背景和重要性、定义与层次介绍、训练与优化，详细分析了其卷积层、激活函数、池化层、归一化层，最后列出其训练与优化的多项关键技术：训练集准备与增强、损失函数、优化器、学习率调整、正则化技巧与模型评估调优。

一、引言

卷积神经网络（Convolutional Neural Networks, CNN）的复杂性和灵活性使其成为深度学习领域的核心研究主题之一。在本引言部分中，我们将深入探讨CNN的历史背景、基本原理、重要性以及其在科学和工业领域的影响。

在这里插入图片描述

1.1 背景和重要性

卷积神经网络的灵感源自人类视觉系统，特别是视觉皮层中的神经元结构。自Hubel和Wiesel在1962年的开创性工作以来，这一理念已经引发了一系列研究和发展。

早期发展: 由Yann LeCun等人在上世纪80年代末到90年代初开发的LeNet-5被视为第一个成功的卷积神经网络。LeNet-5在手写数字识别方面取得了令人印象深刻的结果。
现代崛起: 随着硬件的快速进展和大数据的涌现，CNN在21世纪初开始重新崛起，并在各个领域实现了突破性进展。

CNN的重要性不仅体现在其精度和效率上，而且还体现在其理论洞见上。例如，卷积层通过共享权重减少了参数数量，这有助于更有效地训练模型，还增强了模型对平移不变性的理解。

1.2 卷积神经网络概述

卷积神经网络是一种前馈神经网络，它的人工神经元可以响应周围单元的局部区域，从而能够识别视觉空间的部分结构特征。以下是卷积神经网络的关键组成部分：

卷积层: 通过卷积操作检测图像的局部特征。
激活函数: 引入非线性，增加模型的表达能力。
池化层: 减少特征维度，增加模型的鲁棒性。
全连接层: 在处理空间特征后，全连接层用于进行分类或回归。

卷积神经网络的这些组件协同工作，使得CNN能够从原始像素中自动学习有意义的特征层次结构。随着深度增加，这些特征从基本形状和纹理逐渐抽象为复杂的对象和场景表现。

卷积神经网络的独特优势在于其能够自动化许多传统机器学习中需要人工干预的特征工程部分。这一点不仅使其在许多任务中取得了优越性能，还激发了广泛的学术和工业界的兴趣。

二、卷积神经网络层介绍

卷积神经网络由多个层组成，每个层具有特定的目的和功能。这一部分将探讨卷积操作、激活函数、池化层、归一化层基本概念。

2.1 卷积操作

卷积操作是卷积神经网络的核心，涉及多个复杂的概念和细节。我们将逐一介绍它们。
在这里插入图片描述

卷积核与特征映射

卷积核是一个小型的矩阵，通过在输入上滑动来生成特征映射。每个卷积核都能捕获不同的特征，例如边缘、角点等。

卷积核大小

在这里插入图片描述

卷积核的大小影响了它能捕获的特征的尺度。较小的卷积核可以捕获更细致的特征，而较大的卷积核可以捕获更广泛的特征。

# 使用3x3的卷积核
conv_layer_small = nn.Conv2d(3, 64, 3)
# 使用5x5的卷积核
conv_layer_large = nn.Conv2d(3, 64, 5)

多通道卷积

在多通道输入下进行卷积，每个输入通道与一个卷积核进行卷积，然后所有的结果相加。这允许模型从不同的通道捕获不同的特征。

步长与填充

步长和填充控制卷积操作的几何属性。

步长

步长定义了卷积核在输入上移动的速度。较大的步长可以减少输出的尺寸，而较小的步长则保持尺寸不变。

# 使用步长2
conv_layer_stride2 = nn.Conv2d(3, 64, 3, stride=2)

填充

填充通过在输入边缘添加零来控制输出的尺寸。这有助于控制信息在卷积操作中的丢失。

# 使用填充1，使得输出尺寸与输入尺寸相同（假设步长为1）
conv_layer_padding1 = nn.Conv2d(3, 64, 3, padding=1)

空洞卷积（Dilated Convolution）

空洞卷积是一种扩展卷积核感受野的方法，它在卷积核的元素之间插入空白。这允许网络捕获更广泛的信息，而不增加卷积核的大小或计算量。

# 使用空洞率2的卷积核
conv_layer_dilated = nn.Conv2d(3, 64, 3, dilation=2)

分组卷积（Grouped Convolution）

分组卷积通过将输入通道分组并对每组使用不同的卷积核来扩展卷积操作。这增加了模型的容量，并使其能够学习更复杂的表示。

# 使用2个分组
conv_layer_grouped = nn.Conv2d(3, 64, 3, groups=2)

2.2 激活函数

在这里插入图片描述

激活函数在神经网络中起到了至关重要的作用。它们增加了模型的非线性，从而使其能够学习和逼近复杂的函数。

ReLU激活函数

ReLU（Rectified Linear Unit）是现代深度学习中最流行的激活函数之一。它是非线性的，但计算非常高效。

优势与劣势

ReLU的主要优点是计算效率高和促进稀疏激活。然而，它可能会导致"死亡ReLU"现象，其中某些神经元永远不会被激活。

# 使用PyTorch定义ReLU激活函数
relu = nn.ReLU()

Leaky ReLU

Leaky ReLU是ReLU的一种变体，允许负输入值的小正斜率。这有助于缓解"死亡ReLU"问题。

# 使用PyTorch定义Leaky ReLU激活函数
leaky_relu = nn.LeakyReLU(0.01)

Sigmoid激活函数

Sigmoid激活函数可以将任何值压缩到0和1之间。

优势与劣势

Sigmoid用于输出层可以表示概率，但在隐藏层中可能会导致梯度消失问题。

# 使用PyTorch定义Sigmoid激活函数
sigmoid = nn.Sigmoid()

Tanh激活函数

Tanh是另一个类似于Sigmoid的激活函数，但它将输出压缩到-1和1之间。

优势与劣势

Tanh通常优于Sigmoid，因为它的输出范围更大，但仍可能导致梯度消失。

# 使用PyTorch定义Tanh激活函数
tanh = nn.Tanh()

Swish激活函数

Swish是一种自适应激活函数，可能会自动调整其形状以适应特定问题。

# 使用PyTorch定义Swish激活函数
class Swish(nn.Module):
    def forward(self, x):
        return x * torch.sigmoid(x)

其他激活函数

还有许多其他激活函数，例如Softmax、Mish、ELU等，各有各的优点和适用场景。

激活函数的选择

激活函数的选择取决于许多因素，例如模型架构、数据类型和特定任务的需求。通过实验和调整，可以找到适合特定问题的最佳激活函数。

2.3 池化层

在这里插入图片描述

池化层（Pooling Layer）在卷积神经网络中扮演了重要角色，通常用于降低特征映射的维度，从而减少计算需求，并增加特征检测器的感受野。

最大池化（Max Pooling）

最大池化是最常用的池化技术之一。它通过选择窗口中的最大值来降低特征映射的尺寸。

# 使用PyTorch定义2x2的最大池化层
max_pooling = nn.MaxPool2d(2)

优势与劣势

最大池化的主要优点是它能保留窗口中的最显著特征。然而，它会丢失一些细节信息。

平均池化（Average Pooling）

与最大池化不同，平均池化使用窗口中所有值的平均值。

# 使用PyTorch定义2x2的平均池化层
average_pooling = nn.AvgPool2d(2)

优势与劣势

平均池化可以减轻最大池化可能导致的过于突出某些特征的问题，但可能会淡化一些重要特征。

全局平均池化（Global Average Pooling）

全局平均池化是一种更复杂的池化策略，它计算整个特征映射的平均值。这常用于网络的最后一层，直接用于分类。

# 使用PyTorch定义全局平均池化层
global_average_pooling = nn.AdaptiveAvgPool2d(1)

池化窗口大小和步长

池化窗口的大小和步长会直接影响输出的尺寸。较大的窗口和步长会更显著地降低尺寸。

池化的替代方案

池化层已经有了一些现代替代方案，例如使用卷积层的步长大于1，或使用空洞卷积。这些方法可能提供更好的特征保存。

池化层的选择

选择特定类型的池化层取决于任务需求和特定数据特性。深入理解各种池化技术如何工作，可以帮助深入理解它们是如何影响模型性能的。

2.4 归一化层

在这里插入图片描述

归一化层在训练深度神经网络时扮演了关键角色，主要用于改善训练的稳定性和速度。通过将输入数据缩放到合适的范围，归一化层有助于缓解训练过程中的梯度消失和梯度爆炸问题。

批量归一化（Batch Normalization）

批量归一化通过对每个特征通道的输入进行归一化，将输入缩放到零均值和单位方差。

# 使用PyTorch定义批量归一化层
batch_norm = nn.BatchNorm2d(num_features=64)

优势与劣势

优势：它允许更高的学习率，提供了一些正则化效果，通常导致更快的训练。
劣势：在小批量上的统计估计可能会导致训练和推理间的不一致。

层归一化（Layer Normalization）

层归一化是在单个样本上对所有特征进行归一化的变体。它在句子处理和循环神经网络中特别流行。

# 使用PyTorch定义层归一化
layer_norm = nn.LayerNorm(normalized_shape=64)

实例归一化（Instance Normalization）

实例归一化主要用于样式转换任务，归一化是在每个样本的每个通道上独立进行的。

# 使用PyTorch定义实例归一化
instance_norm = nn.InstanceNorm2d(num_features=64)

组归一化（Group Normalization）

组归一化是批量归一化和层归一化之间的一种折衷方案，将通道分为不同的组，并在每个组内进行归一化。

# 使用PyTorch定义组归一化
group_norm = nn.GroupNorm(num_groups=32, num_channels=64)

归一化层的选择

归一化层的选择应基于特定的任务和模型架构。例如，在视觉任务中，批量归一化可能是首选，而在NLP任务中，层归一化可能更有用。

三、训练与优化

在这里插入图片描述

卷积神经网络的训练和优化涉及许多关键组件和技术，它们共同决定了模型的性能和可用性。下面详细介绍这些方面。

3.1 训练集准备与增强

有效的训练数据是深度学习成功的基础。为了使卷积神经网络有效学习，训练集的选择和增强至关重要。

数据预处理

预处理是训练集准备的关键步骤，包括：

标准化：将输入缩放到0-1范围。
中心化：减去均值，使数据以0为中心。
数据清洗：消除不一致和错误的数据。

数据增强

数据增强是一种通过应用随机变换增加数据量的技术，从而增加模型的泛化能力。

常见增强技巧

图像旋转、缩放和剪裁
颜色抖动
随机噪声添加

# 使用PyTorch进行多种图像增强
from torchvision import transforms
transform = transforms.Compose([
    transforms.RandomRotation(10),
    transforms.RandomResizedCrop(224),
    transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1)
])

训练集分割

通常将数据分为训练集、验证集和测试集，以确保模型不会过拟合。

3.2 损失函数

损失函数衡量模型预测与真实目标之间的差距。选择适当的损失函数是优化模型性能的关键步骤。

回归任务

对于连续值预测，通常使用：

均方误差（MSE）：衡量预测值与真实值之间的平方差。

# 使用PyTorch定义MSE损失
mse_loss = nn.MSELoss()

平滑L1损失：减少异常值的影响。

分类任务

对于类别预测，常见的损失函数包括：

交叉熵损失：衡量预测概率分布与真实分布之间的差异。

# 使用PyTorch定义交叉熵损失
cross_entropy_loss = nn.CrossEntropyLoss()

二元交叉熵损失：特别用于二分类任务。
多标签损失：适用于多标签分类。

优化损失函数

选择适当的损失函数不仅取决于任务类型，还与模型架构、数据分布和特定的业务指标有关。有时，自定义损失函数可能是必要的，以便捕捉特定问题的核心挑战。

3.3 优化器

优化器用于更新神经网络的权重，以便最小化损失函数。每种优化器都有其特定的数学原理和应用场景。

随机梯度下降（SGD）

SGD是最基本的优化算法。

基本SGD: 按照负梯度方向更新权重。
带动量的SGD: 引入动量项，积累之前的梯度，以便更平稳地收敛。

# 使用PyTorch定义带动量的SGD优化器
optimizer_sgd_momentum = torch.optim.SGD(model.parameters(), lr=0.01, momentum=0.9)

自适应优化器

自适应优化器能自动调整学习率。

Adam: 结合了Momentum和RMSProp的优点。

# 使用PyTorch定义Adam优化器
optimizer_adam = torch.optim.Adam(model.parameters(), lr=0.001)

Adagrad、RMSprop等: 针对不同参数有不同的学习率。

优化器选择注意事项

任务相关性: 不同优化器在不同任务和数据上可能有不同的效果。
超参数调优: 如学习率、动量等可能需要调整。

3.4 学习率调整

学习率是优化器中的关键超参数，其调整对模型训练有深远影响。

固定学习率

最简单的方法是使用固定学习率。但可能不够灵活。

学习率调度

更复杂的方法是在训练过程中动态调整学习率。

预定调整

步骤下降: 在固定步骤处降低学习率。
余弦退火: 周期性调整学习率。

# 使用PyTorch定义余弦退火调度器
scheduler = torch.optim.lr_scheduler.CosineAnnealingLR(optimizer_adam, T_max=50)

自适应调整

ReduceLROnPlateau: 基于验证损失降低学习率。

学习率预热

训练初期逐渐增加学习率。

线性预热: 初始阶段线性增加学习率。

3.5 正则化技巧

正则化是防止过拟合和提高模型泛化能力的关键技术。

L1和L2正则化

L1正则化：倾向于产生稀疏权重，有助于特征选择。
L2正则化：减小权重，使模型更平滑。

# 使用PyTorch添加L1和L2正则化
l1_lambda = 0.0005
l2_lambda = 0.0001
loss = loss + l1_lambda * torch.norm(weights, 1) + l2_lambda * torch.norm(weights, 2)

Dropout

随机关闭一部分神经元，使模型更鲁棒。

普通Dropout：随机丢弃神经元。
Spatial Dropout：在卷积层中随机丢弃整个特征图。

Batch Normalization

通过标准化层输入，加速训练并减轻初始化的敏感性。

数据增强

如前所述，数据增强是一种重要的正则化手段。

3.6 模型评估与调优

模型评估是衡量模型性能的过程，调优则是改进性能。

交叉验证

使用交叉验证来估计模型的泛化能力。

k-折交叉验证：将数据分为k个部分，轮流使用其中一个作为验证集。

调参技巧

网格搜索：尝试不同超参数组合。
随机搜索：随机选择超参数，更高效。

早停技巧

如果验证损失不再下降，则停止训练，以防止过拟合。

模型集成

通过结合多个模型来提高性能。

Bagging：训练多个模型并平均预测。
Boosting：在先前模型的错误上训练新模型。
Stacking：使用新模型组合其他模型的预测。

4. 总结

[外链图片转存中...(img-kMlGvINe-1705163206359)]

通过上面文章内容我们全面探讨了卷积神经网络CNN，深入分析了背景和重要性、定义与层次介绍、训练与优化，详细分析了其卷积层、激活函数、池化层、归一化层，最后列出其训练与优化的多项关键技术：训练集准备与增强、损失函数、优化器、学习率调整、正则化技巧与模型评估调优。

发布时间：2024-01-18 09:46:23
http://www.litoo.cn/news/318.html

一张图读懂人工智能

三、人工智能和多式联运 AI产品的发展趋势，以及语言模型的应急能力和广泛应用。视频探讨了人工智能和人类的优劣势，以及未来的发展方向。视频提出了一种积极的心态，认为人工智能可以成为我们的同事，帮助我们提高效率和能力。二、大型语言模型的训练过程和应用场景，包括文本到文本、图像到文本、语音转录等多个方面。同时也提到了不同模型的能力和成本。一、生成人工智能的概念和应用，以及如何使用大型语言模型进行聊天和创造原创内容。五、如何使用生成人工智能作为招聘公司的工具，以及如何有效地使用生成人工智能来制作有用结果的提示。

AI专题 2024/03/03 13:55:45

C语言中strstr函数的使用！

这里要进行分析，有一个重要的点就是，成勋会返回abc及其后面的字符，如上图所示p2代表abc，而abc在p1中能够找到，所以返回abc和p1中abc后面的所有字符，这是一个需要注意的地方。//判断p2字符串是不是在p1中，如果在就是子字符串，否则不是。if (ret == NULL) //函数返回值是保存在ret这个字符指针变量中的，为空说明不是子字符串。printf("子字符串不在\n");具体直接看下面的这段代码我相信你必明白。

编程日记 2024/02/28 09:12:59

基于YOLOv8深度学习+Pyqt5的电动车头盔佩戴检测系统

该系统利用深度学习技术，通过训练YOLOv8模型来识别电动车骑行者是否佩戴头盔，并在检测到未佩戴头盔的情况下发出警报。因此，开发一种能够实时监测头盔佩戴情况的系统，对于提高骑行者的安全意识和减少交通事故具有重要作用。本文提出的基于YOLOv8的电动车头盔佩戴检测系统，能够有效地提高电动车骑行者的安全意识。YOLOv8是YOLO系列目标检测模型的最新版本，它在前代模型的基础上进行了优化，提高了检测速度和准确性。在不同的场景和光照条件下，模型均能稳定地识别出佩戴和未佩戴头盔的骑行者。wx供重浩：创享日记。

编程日记 2024/02/27 21:34:08

chatgpt的大致技术原理

在RLHF中，人类用户对模型生成的文本提供反馈（如打分或选择更喜欢的文本），然后模型根据这些反馈进行进一步的训练。预处理步骤包括分词（使用BPE算法将文本分解为更小的子单元，如单词或符号）、去除停用词（即那些对文本意义不大的词，如“的”、“了”等）以及其他可能的文本清洗工作。生成过程中，模型会考虑前文的上下文信息，以确保生成的文本是连贯和有意义的。通过收集大量的文本数据、建立深度学习模型、进行预训练和微调以及使用搜索算法和人类反馈强化学习等技术，ChatGPT能够生成高质量、连贯且有用的文本回复。

chatgpt教程 2024/02/22 08:59:36

基于Python3的数据结构与算法 - 03 插入排序

观察我们写的算法后发现：该算法的时间复杂度也为O(

编程日记 2024/02/21 09:45:57

云计算与边缘计算：有什么区别？

云计算和边缘计算作为不同的计算范式，各自在特定场景中发挥着独特的作用。它们的区别体现在数据处理位置、延迟、可用性以及应用场景等方面。然而，随着数字化时代的发展，它们也逐渐形成了协同应用的趋势，充分发挥各自的优势，提供更灵活、高效的计算体系结构。未来，随着智能化、自动化和边缘计算的边界拓展，云计算和边缘计算将进一步推动数字化转型。同时，安全性、跨边缘计算标准和环境可持续性等问题也需要在未来的发展中得到更好的解决。

编程日记 2024/02/09 09:31:04

ChatGPT高效提问—prompt基础

设计一个好的prompt对于获取理想的生成结果至关重要。通过选择合适的关键词、提供明确的上下文、设置特定的约束条件，可以引导模型生成符合预期的回复。例如，在对话中，可以使用明确的问题或陈述引导模型生成相关、具体的回答；在摘要生成中，可以提供需要摘要的文章段落作为prompt，以确保生成的摘要准确而精炼。

chatgpt教程 2024/02/08 18:15:59

C# 常用排序算法（冒泡排序插入排序选择排序快速排序归并排序堆排序）

建堆阶段将无序列表转换为堆，排序阶段将堆的根节点依次取出，并调整堆，完成排序。它使用分治法的思想，通过选择一个基准元素，将列表分成两个子列表，并对每个子列表递归地进行排序。它重复地遍历要排序的列表，比较相邻的两个元素，并交换它们的位置，直到列表排序完成为止。每次遍历都会将最大的元素移动到列表的末尾。每次选择未排序部分的最小元素，并将其放到已排序部分的末尾，逐步构建有序序列。它将列表分成较小的子列表，对每个子列表进行排序，然后再将子列表合并成较大的有序列表，直到整个列表排序完成。

编程日记 2024/02/02 14:06:09

二维平面阵列波束赋形原理和Matlab仿真

阵面左下角天线位于坐标原点，将坐标原点阵元设为参考阵元，计算每个阵元相对于该参考阵元的入射波程差，从而来计算每个阵元接收的回波信号。实现波束赋形的最基本的方法是对各个天线阵元的信号进行适当延迟后相加，使目标方向的信号同相叠加得到增强，而其他方向均有不同程度的削弱，该方法通常用于模拟信号.根据上述理论推导可以仿真任意平面阵列的方向图，这里对两种典型的阵列（矩形平面阵列和圆形阵列）进行Matlab仿真，其余类型的阵列在此基础上修改即可。根据上述圆形阵列公式做仿真，得到下述的三维空间方向图。

编程日记 2024/02/01 14:42:32

人工智能与机器学习——开启智能时代的里程碑

人工智能是指使计算机系统表现出类似于人类智能的能力。其目标是实现机器具备感知、理解、学习、推理和决策等智能行为。人工智能的发展可以追溯到上世纪50年代，随着计算机技术和算法的不断进步，人工智能得以实现。机器学习是人工智能的一个重要分支，它通过让计算机从数据中学习和改进性能，而不需要明确的编程指令。机器学习可以分为监督学习、无监督学习和强化学习三种主要类型。

AI专题 2024/01/31 20:40:59

为什么Java中的String类被设计为final类？

String类作为Java中不可或缺的类之一，被设计成final类带来了不可变性、安全性、可靠性和性能优势。不可变的特性使得String对象在多线程环境下安全共享，提高了应用程序的并发性和性能。此外，String类的设计还符合Java类库的一致性和规范，确保了整个语言的稳定性和可靠性。因此，String类被设计成final类是出于多方面的考虑，以提供最佳的使用体验和编程效率。

编程日记 2024/01/27 08:53:11

【GPU】深入理解GPU硬件架构及运行机制

GPU的基本底层构成，主要是以GPU计算核心 Cores，以及Memory以及控制单元，三大组成要素组成。Core是计算的基本单元，既可以用作简单的浮点运算，又可以做一些复杂的运算例如，tensor 或者ray tracing。多个core之间通讯的方式：在特定的应用场合多个core之间是不需要的通讯的，也就是各干各的（例如图像缩放）。但是也有一些例子，多个core之间要相互通讯配合（例如上文谈到的数组求和问题），每个core之间都可以实现交互数据是非常昂贵的，

编程日记 2024/01/26 11:08:50

新能源汽车智慧充电桩管理方案：环境监测与充电安全多维感知

通过接入各类环境检测传感器及应用，不仅提高了充电桩及站点的管理效率和维护质量，还为电动汽车用户提供了更加安全、便捷的充电服务。

编程日记 2024/01/25 16:20:19

RAG中的3个高级检索技巧

我们介绍的这些检索技术有助于提高文档的相关性。但是这方面的研究还正在进行，还有很多其他方法例如,利用真实反馈数据对嵌入模型进行微调；直接微调LLM以使其检索能力最大化(RA-DIT)；探索更复杂的嵌入适配器使用深度神经网络而不是矩阵；深度和智能分块技术作者：Ahmed Besbes。

编程日记 2024/01/21 10:03:20

从虚拟到现实：数字孪生驱动智慧城市可持续发展

同时，我们也需要不断探索和创新数字孪生技术的应用场景和发展方向，为智慧城市的可持续发展提供更加全面和深入的支持。“方案365”2023年全新整理智慧城市、数字孪生、乡村振兴、智慧乡村、元宇宙、数据中台、智慧园区、智慧社区、智慧矿山、城市生命线、智慧水利、智慧应急、智慧校园、智慧工地、智慧农业、智慧文旅、智慧交通等300+行业全套解决方案。通过智能电表和能源管理系统，数字孪生技术可以实现对家庭、企业等各个层面的能源使用情况进行监测和优化，提高能源利用效率，推动城市的绿色发展。

编程日记 2024/01/13 00:40:29

如何使用人工智能优化 DevOps？

DevOps 和人工智能密不可分，影响着各种业务。DevOps 可以加快产品开发速度并简化现有部署的维护，而 AI 则可以改变整个系统的功能。DevOps团队可以依靠人工智能和机器学习来进行数据集成、测试、评估和发布系统。更重要的是，人工智能和机器学习可以以高效、快速、安全的方式改进 DevOps 驱动的流程。从开发人员实用性和业务支持的角度来看，评估AI和ML在 DevOps 中的重要性对于企业来说是有益的。

编程日记 2024/01/12 22:25:05

ElasticSearch 集群搭建与状态监控cerebro

在单机上利用docker容器运行多个es实例来模拟es集群。部署es集群可以直接使用docker-compose来完成，但要求Linux虚拟机至少有4GI的内存空间。"number_of_replicas": 1 // 副本数。"number_of_shards": 3，// 分片款量。kibana可以监控es集群，不过新版本需要依赖es的x-pack 功能，配置比较复杂。第一种方式：利用kibana的DevTools创建索引库 ,在DevTools中输入指令。第二种方式：利用cerebro创建索引库。

编程日记 2024/01/09 18:16:38

C# Onnx Chinese CLIP 通过一句话从图库中搜出来符合要求的图片

编程日记 2024/01/06 21:02:14

Zoho SalesIQ：构建客户服务知识库的实用工具与指南

客户服务知识库是一个集中的信息存储库，提供常见问题解答(FAQ)、故障排除指南、分步教程和其他资源。它旨在使客户能够自己找到解决方案，同时还可以减轻您的支持团队的工作量。

编程日记 2024/01/06 15:37:59

感知与认知的碰撞，大模型时代的智能文档处理范式

第十九届中国图象图形学学会青年科学家会议上，合合信息带来了关于多模态大模型赋能文档处理的相关内容，欢迎感兴趣的同学了解~

编程日记 2024/01/04 10:10:05

人工智能有哪些领域？

像京东自主研发的无人仓采用大量智能物流机器人进行协同与配合，通过人工智能、深度学习、图像智能识别、大数据应用等技术，让工业机器人可以进行自主的判断和行为，完成各种复杂的任务，在商品分拣、运输、出库等环节实现自动化。人工智能在金融领域的应用主要有：智能获客、身份识别、大数据风控、智能投顾、智能客服、金融云等，该行业也是人工智能渗透最早、最全面的行业。目前，我国在ITS方面的应用主要是通过对交通中的车辆流量、行车速度进行采集和分析，可以对交通进行实施监控和调度，有效提高通行能力、简化交通管理、降低环境污染等。

编程日记 2024/01/03 19:32:21

OpenCV：计算机视觉的强大工具库

计算机视觉的强大工具库一、什么是OpenCV？二、OpenCV的功能和特点三、OpenCV的应用领域四、OpenCV在实践中的重要性五、OpenCV的未来展望

编程日记 2024/01/02 21:03:17

使用LOTR合并检索提高RAG性能

为了解决LIM问题并提高检索性能，对RAG系统进行增强是非常重要的。通过设置不同的VectorStores并将它们与Merge retriver结合，以及使用LongContextReorder重新排列结果，可以减少LIM问题并使检索过程更高效。此外，在合并检索器中合并特定领域的嵌入也有着关键作用。这些步骤对于确保我们不会在检索文件的过程中遗漏重要细节至关重要。Lost in the Middle: How Language Models Use Long Contexts 论文。

编程日记 2023/12/30 18:58:08

Hadoop之MapReduce 详细教程

为了开发我们的 MapReduce 程序，一共可以分为以上八个步骤，其中每个步骤都是一个 class 类，我们通过 job 对象将我们的程序组装成一个任务提交即可。为了简化我们的 MapReduce 程序的开发，每一个步骤的 class 类，都有一个既定的父类，让我们直接继承即可，因此可以大大简化我们的 MapReduce 程序的开发难度，也可以让我们快速的实现功能开发。MapReduce 编程当中，其中最重要的两个步骤就是我们的 Mapper 类和 Reducer类Mapper 抽象类的基本介绍。

大数据 2023/12/29 10:14:14

大数据深度学习卷积神经网络CNN：CNN结构、训练与优化一文全解

文章目录

大数据深度学习卷积神经网络CNN：CNN结构、训练与优化一文全解

一、引言

1.1 背景和重要性

1.2 卷积神经网络概述

二、卷积神经网络层介绍

2.1 卷积操作

卷积核与特征映射

卷积核大小

多通道卷积

步长与填充

步长

填充

空洞卷积（Dilated Convolution）

分组卷积（Grouped Convolution）

2.2 激活函数

ReLU激活函数

优势与劣势

Leaky ReLU

Sigmoid激活函数

优势与劣势

Tanh激活函数

优势与劣势

Swish激活函数

其他激活函数

激活函数的选择

2.3 池化层

最大池化（Max Pooling）

优势与劣势

平均池化（Average Pooling）

优势与劣势

全局平均池化（Global Average Pooling）

池化窗口大小和步长

池化的替代方案

池化层的选择

2.4 归一化层

批量归一化（Batch Normalization）

优势与劣势

层归一化（Layer Normalization）

实例归一化（Instance Normalization）

组归一化（Group Normalization）

归一化层的选择

三、训练与优化

3.1 训练集准备与增强

数据预处理

数据增强

常见增强技巧

训练集分割

3.2 损失函数

回归任务

分类任务

优化损失函数

3.3 优化器

随机梯度下降（SGD）

自适应优化器

优化器选择注意事项

3.4 学习率调整

固定学习率

学习率调度

预定调整

自适应调整

学习率预热

3.5 正则化技巧

L1和L2正则化

Dropout

Batch Normalization

数据增强

3.6 模型评估与调优

交叉验证

调参技巧

早停技巧

模型集成

4. 总结

相关文章