AI开发-python-langchain框架（3-1-向量化）

张开发

• 2026/4/15 0:33:29 • 15 分钟阅读

分享文章

all-MiniLM-L6-v2是Sentence-BERTSBERT系列中最经典、最常用的轻量级文本嵌入模型核心作用和特点如下1. 核心功能文本→向量的语义转换器该模型的核心作用是将任意长度的文本句子 / 短语 / 短段落转换为固定维度384 维的稠密向量也叫嵌入向量 / Embedding且转换后的向量具备以下关键特性语义关联性语义相似的文本生成的向量在向量空间中的距离也更近比如猫抓老鼠和猫咪捉老鼠的向量相似度极高数值归一化输出向量默认做了 L2 归一化可直接用于余弦相似度计算多语言兼容对中文、英文等主流语言都有较好的语义捕捉能力无需额外适配。2. 典型应用场景为什么这个模型被广泛使用表格应用场景具体作用文本相似度计算计算两个句子的余弦相似度用于查重、语义匹配如问答匹配、文本聚类向量检索RAG 核心将文本向量存入向量数据库如 FAISS/Milvus实现语义检索而非关键词检索文本分类 / 聚类用生成的向量作为特征输入训练轻量级分类器如情感分析、意图识别大模型 RAG 增强作为 RAG检索增强生成的核心组件将用户问题和知识库文本转为向量实现精准检索3. 模型的核心优势为什么选它而非其他模型轻量级模型体积小约 800MB、推理速度快适合本地部署或低算力场景效果均衡在速度 - 效果权衡中表现最优384 维向量既保证语义信息量又避免维度爆炸易用性通过 SentenceTransformer 库可一键加载无需手动处理分词、模型微调等复杂步骤开源免费基于 MIT 协议可商用无版权限制。4. 补充说明该模型的输出维度固定为 384 维是 MiniLM 系列简化版 BERT的优化版本若需要更高的语义精度可选择all-mpnet-base-v2768 维效果更好但体积更大若需要更低的算力消耗可选择all-MiniLM-L4-v2384 维推理更快。看看代码部分1234567891011121314151617181920212223242526272829303132# 导入SentenceTransformer库该库专门用于加载和使用预训练的句子/文本嵌入模型fromsentence_transformersimportSentenceTransformer# 核心配置 # 本地模型文件的存储路径需确保该路径下有完整的all-MiniLM-L6-v2模型文件model_pathD:\\pythonProject2024\\pythonProject\\modelTest\\model\\all-MiniLM-L6-v2# 模型加载 # 加载本地预训练的all-MiniLM-L6-v2模型# 该模型是轻量级的句子嵌入模型核心用于将文本转换为固定维度的向量表示modelSentenceTransformer(model_path)# 示例文本 # 待生成向量嵌入的示例文本列表支持多语言中文/英文均可sentences[这是第一个示例句子,这是第二个示例句子,Hello, how are you?]# 生成向量嵌入 # 调用模型的encode方法将文本列表转换为向量嵌入# encode方法会自动完成文本预处理分词、归一化→ 模型推理 → 向量归一化的全流程embeddingsmodel.encode(sentences)# 结果输出 # 打印向量维度all-MiniLM-L6-v2固定输出384维向量print(f向量维度: {embeddings.shape[1]})# 输出: 向量维度: 384# 遍历打印每个句子的向量仅显示前5个元素避免输出过长fori, embeddinginenumerate(embeddings):print(f句子 {i1} 的向量: {embedding[:5]}...)# 示例输出: 句子 1 的向量: [0.0123, -0.0456, 0.0789, 0.0234, -0.0567]...数据结果向量维度: 384句子 1 的向量: [-0.01811877 0.10055622 0.07948062 0.00487238 0.02543747]...句子 2 的向量: [-0.05084108 0.09896706 0.01865453 -0.02641223 -0.04201426]...句子 3 的向量: [ 0.01909676 0.03446515 0.09162795 0.07016529 -0.02994661]...补充说明向量的维度是由选择的向量模型决定的python环境的依赖如下12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485annotated-types0.7.0anyio4.12.0certifi2025.11.12charset-normalizer3.4.4click8.3.1dataclasses-json0.6.7faiss-cpu1.13.0fastapi0.128.0h110.16.0httpcore1.0.9httpx0.28.1httpx-sse0.4.3huggingface-hub0.36.0idna3.11Jinja23.1.6jiter0.12.0jsonschema4.25.1jsonschema-specifications2025.9.1langchain0.1.20langchain-classic1.0.0langchain-community0.0.38langchain-core0.2.43langchain-experimental0.0.54langchain-milvus0.3.1langchain-openai0.0.5langchain-text-splitters0.0.2langchainhub0.1.21langdetect1.0.9langgraph0.1.10langgraph-checkpoint3.0.1langgraph-prebuilt1.0.5langgraph-sdk0.2.14langsmith0.1.147lark1.3.1MarkupSafe3.0.3marshmallow3.26.1multidict6.7.0mypy_extensions1.1.0numpy1.26.4openai1.109.1orjson3.11.5ormsgpack1.12.0overrides7.7.0packaging23.2pandas2.3.3pydantic2.12.5pydantic-settings2.12.0pydantic_core2.41.5Pygments2.19.2pymilvus2.5.0python-dateutil2.9.0.post0python-dotenv1.2.1python-multipart0.0.22pytz2025.2referencing0.37.0regex2025.11.3requests2.32.5requests-toolbelt1.0.0rpds-py0.30.0safetensors0.7.0scikit-learn1.7.2scipy1.16.3sentence-transformers5.1.2six1.17.0sniffio1.3.1SQLAlchemy2.0.44starlette0.50.0tenacity8.5.0threadpoolctl3.6.0tiktoken0.5.2tokenizers0.22.1torch2.9.1tqdm4.67.1transformers4.57.3types-requests2.32.4.20260107typing-inspect0.9.0typing-inspection0.4.2typing_extensions4.15.0tzdata2025.2ujson5.11.0unstructured0.18.21unstructured-client0.42.4urllib32.6.0uvicorn0.40.0yarl1.22.0

更多文章

前端开发 2026/4/12 18:01:11

BootDo开源项目实战指南：从部署到定制的完整路径

BootDo开源项目实战指南：从部署到定制的完整路径【免费下载链接】bootdo 项目地址: https://gitcode.com/gh_mirrors/bo/bootdo 一、核心价值与功能架构 BootDo作为企业级快速开发平台，整合了权限管理、工作流引擎、内容管理等核心功能模块。其…

vsftpd报530 Login incorrect终极排错指南：从日志分析到欧拉系统特有问题当FTP服务器抛出"530 Login incorrect"错误时，运维工程师往往需要像侦探一样抽丝剥茧。这个看似简单的认证失败提示，背后可能隐藏着从配置错误到系统兼容性…

张开发

前端开发 2026/4/10 1:25:30

百考通：AI精准赋能期刊论文写作，让研究更顺畅

在学术研究领域，期刊论文的撰写是成果输出的关键环节，却也让众多科研工作者与学生倍感压力：选题迷茫、逻辑梳理困难、格式规范复杂、内容提炼耗时，严重拖慢了学术成果的发表节奏。百考通（https://www.baikaotongai.com…

张开发

AI开发-python-langchain框架（3-1-向量化）

最新文章

01-18-09 接口稳定性保障

新能源知识库（46）光储一体机多场景应用解析

14款主流富文本编辑器深度评测：从功能到实战应用

多智能体强化学习实战：HATRPO与HAPPO在复杂环境中的性能对比与优化策略

向量数据库选型与实战：大模型应用落地的核心基建指南

JavaScript中闭包在定时器setTimeout中变量持久化

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

BootDo开源项目实战指南：从部署到定制的完整路径

HSTracker全能助手：炉石传说数据追踪与套牌管理实战指南

加密货币自动化交易实战指南：从策略设计到收益优化全流程

YimMenu终极指南：GTA5增强工具完整解析与安全部署

JSON Formatter终极实战：如何高效构建交互式JSON可视化组件？

5分钟上手：轻量级SVG在线编辑器完全指南

2025届必备的十大AI写作方案横评

2025届必备的AI论文网站推荐榜单

自然语言处理综述

别再死磕CARLA了！用Python+gym+highway-env快速搭建你的第一个自动驾驶AI（附完整代码）

vsftpd报530 Login incorrect终极排错指南：从日志分析到欧拉系统特有问题

百考通：AI精准赋能期刊论文写作，让研究更顺畅

AI开发-python-langchain框架（3-1-向量化 ）

最新文章

01-18-09 接口稳定性保障

新能源知识库（46）光储一体机多场景应用解析

14款主流富文本编辑器深度评测：从功能到实战应用

多智能体强化学习实战：HATRPO与HAPPO在复杂环境中的性能对比与优化策略

向量数据库选型与实战：大模型应用落地的核心基建指南

JavaScript中闭包在定时器setTimeout中变量持久化

推荐文章

龙虾白嫖指南，请查收~勘

AI Agent在金融科技领域的应用实践：风控、投顾与合规

Unity3D动画插件DoTween进阶应用与性能优化指南

超表面贝塞尔光束生成系统代码功能深度解析

【5G系列】深入解析NAS层UAC：Access Identity与Access Category的获取机制

Spring with AI (): 搜索扩展——向量数据库与RAG(下)肺

相关文章

别再死记硬背MIPI状态转换图了！用Python脚本模拟单向/双向Data Lane状态机

HuggingFace模型下载终极优化：Autodl服务器上的国内镜像与断点续传技巧

Python EXE逆向解密深度解析：从加密打包到源码还原的完整流程

基于 Python 与 PyQt5 构建的特斯拉行车记录仪视频播放器

别再搞混了！PyTorch里CrossEntropyLoss和NLLLoss到底该用哪个？（附代码对比）

别再为Linux打印机驱动烦恼：foo2zjs开源驱动彻底解决兼容性问题

分享文章

更多文章

AI开发-python-langchain框架（3-1-向量化）