AI教程

神经网络（Neural Network）是什么？一文读懂神经网络的基本原理

本文深入浅出地讲解神经网络的基本原理，带你从零理解AI的核心技术。通过讲解神经元结构、前向传播与反向传播机制，解析激活函数、权重、损失函数等关键概念，揭示神经网络...

3个月前 AI铺子

108

为什么大模型需要量化？浅析计算效率与资源消耗的平衡策略

在人工智能进入大模型时代后，模型参数量呈现指数级增长。以GPT-3为例，其1750亿参数的模型在FP32格式下占用约350GB存储空间，单次推理需消耗128GB显存。这种资源消耗规模已...

3个月前 dotaai

23

FP32、FP16、INT8、Q4_K_M… 模型精度术语全解析

从FP32到INT8，再到混合量化格式如Q4KM，这些术语不仅定义了数值表示的精度范围，更直接决定了模型在推理速度、内存占用和能耗效率上的表现。本文AI铺子将从数值表示原理、...

3个月前 AI工具集

145

模型量化的三大类型：权重量化、激活量化与混合量化详解

根据量化对象的不同，量化技术可分为三大核心类型：权重量化（Weight Quantization）、激活量化（Activation Quantization）和混合量化（Mixed-Precision Quantization）。...

3个月前 AI工具箱

148

如何为你的硬件选择最合适的量化级别：GPU/VRAM对照表推荐

在深度学习模型部署场景中，量化技术已成为平衡模型性能与硬件资源的关键手段。然而，量化级别的选择并非越激进越好，过度量化会导致模型精度损失超过5%，而保守量化则可能...

3个月前人工智能研究所

58

模型量化是什么意思？一文读懂AI模型压缩核心技术

模型量化（Model Quantization）的本质是将神经网络中连续的浮点数值转换为离散的整数表示，通过降低数值精度实现模型压缩与加速。以FP32到INT8的转换为例，每个权重参数的...

3个月前 AI铺子

64

AI提示词生成器有哪些？8款超好用的AI提示词生成网站推荐

在人工智能技术深度渗透各领域的今天，AI提示词（Prompt）已成为连接人类需求与AI模型输出的关键桥梁。本文AI铺子精选8款经过验证的AI提示词生成工具，从功能定位、操作逻辑...

3个月前 AI铺子

198

将 LoRA 模型部署为 API 服务：FastAPI + vLLM 集成实战

本文AI铺子详细讲解如何通过 FastAPI（高性能异步 Web 框架）与 vLLM（高性能 LLM 推理引擎）集成，实现 LoRA 模型的低延迟、高吞吐量 API 部署。全程基于真实可复现的步...

3个月前人工智能研究所

106

AI Alignment 入门指南：从目标设定到行为约束超详细教程

本文为AI Alignment（人工智能对齐）初学者提供超详细入门教程，系统讲解从目标设定、价值建模到行为约束的核心方法。涵盖RLHF、偏好学习、宪法AI等关键技术原理与实践步骤...

3个月前 97ai

61

Stable Diffusion 中使用 LoRA 训练个性化画风（附 WebUI 配置步骤）

本文AI铺子详细介绍如何在 Stable Diffusion 中使用 LoRA 技术训练个性化画风，涵盖数据准备、参数设置、模型训练到 WebUI 加载的完整流程。通过图文教程手把手教你打造专属...

3个月前 dotaai

161

AI基础知识、工具使用及实战教程分享

神经网络（Neural Network）是什么？一文读懂神经网络的基本原理

为什么大模型需要量化？浅析计算效率与资源消耗的平衡策略

FP32、FP16、INT8、Q4_K_M… 模型精度术语全解析

模型量化的三大类型：权重量化、激活量化与混合量化详解

如何为你的硬件选择最合适的量化级别：GPU/VRAM对照表推荐

模型量化是什么意思？一文读懂AI模型压缩核心技术

AI提示词生成器有哪些？8款超好用的AI提示词生成网站推荐

将 LoRA 模型部署为 API 服务：FastAPI + vLLM 集成实战

AI Alignment 入门指南：从目标设定到行为约束超详细教程

Stable Diffusion 中使用 LoRA 训练个性化画风（附 WebUI 配置步骤）