【Finetune学习】02：训练到底在干什么？

张开发

• 2026/4/15 3:38:35 • 15 分钟阅读

分享文章

Fintune 前篇：【Finetune学习】01：为什么你的大模型需要“再学习“？上一篇我们知道了 Finetune 是什么、什么时候该用。但当你真正打开训练脚本，看到 loss 曲线在跳动、eval 指标在变化，这些数字到底在说什么？这篇文章回答一个核心问题：训练时真正发生了什么，以及你应该看什么。一、训练的本质：最小化损失函数1.1 什么是损失函数？模型训练的目标只有一个：让模型的输出尽可能接近标准答案。损失函数（Loss Function）就是衡量"差多远"的指标。对于语言模型的 Finetune，最常用的损失函数是交叉熵损失（Cross-Entropy Loss）：L = − 1 T ∑ t = 1 T log ⁡ P θ ( w t ∣ w 1 , w 2 , … , w t − 1 ) \mathcal{L} = -\frac{1}{T}\sum_{t=1}^{T} \log P_\theta(w_t | w_1, w_2, \ldots, w_{t-1})L=−T1t=1∑T

【Finetune学习】02：训练到底在干什么？

最新文章

pgRouting安装及使用示例

hyperf 对接企业微信将消息发送功能改造为异步，使用 HyperF AsyncQueue投递消息任务，失败后自动重试 3 次，超出重试次数后记录

hot100——哈希表

深入大模型-37-learn-claude-code之第十二课学习claude code编程思想的体会

Pixel Language Portal 助力后端开发：构建高并发实时数据处理服务

Kylin-Desktop-V10-SP1-海光版（Hygon C86）安装与配置全指南

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

Gemma-3-12b-it参数解析：OpenClaw任务性能调优全指南

Intv_AI_MK11网络协议深度解析：模型API通信中的关键技术要点

CSS Grid布局如何优化移动端加载性能_避免过多的嵌套网格结构

显式启用-u_printf_float和-u_scanf_float前后的代码尺寸占用实验

彻底解决AutoCAD字体缺失问题：FontCenter字体管理插件完整指南

37-智慧医疗服务平台(在线接诊/问诊)

优化Jetpack Navigation组件：避免Fragment返回时重复执行生命周期方法

从棋盘格到转换矩阵：手眼标定中的坐标系对齐实战

Qwen2.5-7B-Instruct保姆级教学：Streamlit界面定制与交互增强技巧

Go-restful参数处理终极指南：路径、查询和请求体参数完整解析

Go-restful多容器部署终极指南：微服务架构的最佳实践

Hunyuan-MT-7B文旅数字化：敦煌壁画解说词多语种AI翻译与语音合成

【Finetune学习】02：训练到底在干什么？

最新文章

pgRouting安装及使用示例

hyperf 对接企业微信 将消息发送功能改造为异步，使用 HyperF AsyncQueue投递消息任务，失败后自动重试 3 次，超出重试次数后记录

hot100——哈希表

深入大模型-37-learn-claude-code之第十二课学习claude code编程思想的体会

Pixel Language Portal 助力后端开发：构建高并发实时数据处理服务

Kylin-Desktop-V10-SP1-海光版（Hygon C86）安装与配置全指南

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

hyperf 对接企业微信将消息发送功能改造为异步，使用 HyperF AsyncQueue投递消息任务，失败后自动重试 3 次，超出重试次数后记录