视觉基础模型全景扫描:从LeNet到SAM的85种演变

张开发
2026/4/15 6:11:09 15 分钟阅读

分享文章

视觉基础模型全景扫描:从LeNet到SAM的85种演变
视觉基础模型全景扫描从LeNet到SAM的85种演变视觉领域的朋友应该深有体会大规模标注数据的获取成本极高。研究者们通过无标注数据、图文数据以及多模态数据采用对比学习、掩码重建等自监督学习策略预训练得到视觉基础模型再适配到目标检测、语义分割等具体任务。近一年大语言模型和多模态技术的发展催生了更多新型计算机视觉基础模型。截至目前已发布的CV基础模型数量已经相当可观对于从事视觉研究的同学来说这些模型的研究和应用价值极高。本文基于一篇最新综述带大家全面了解这个领域。该综述系统梳理了计算机视觉基础模型包含13大类算法模型以及每一类模型的85个变体涵盖了从LeNet、ResNet到SAM、GPT4的完整发展脉络。此外本文还整理了120篇2021-2023年CV领域的代表性论文部分已开源代码。尽管现有方法已取得不俗效果但CV基础模型的提升空间仍然巨大。希望本文能帮助大家全面掌握该领域的发展脉络厘清模型演进历史找到新的研究方向。论文清单- Surveys12篇- Papers108篇2021年11篇2022年14篇2023年83篇我在做AI算法和大模型课程已经帮助很多同学掌握了核心技术。添加我的企业微信领取免费学习资料和课程试听名额扫码添加备注学习大家好我是资深AI讲师与学习规划师。专注计算机视觉教学与算法研发过去三年我帮超过2500名有Python 基础的入门者从像素是什么到独立跑通CV项目。今天这篇长文完全按零基础实战体系撰写从图像本质到经典算法、再到OpenCV工具链和完整项目一条龙给你讲透可直接复现的CV专业指南。适合人群大学生、转行者、开发者只要会Python基础就能跟上。读完你就能掌握图像处理4大经典算法并拥有一个可直接写进简历的实战项目为方便大家学习 这里给大家整理了一份系统学习资料包 需要的同学 根据下图指示自取就可以

更多文章