技术 #sglang #lmdeploy #vllm #ai #ollama

大模型推理框架深度对比：vLLM、SGLang、LMDeploy与Ollama的架构特性与场景适配

在大模型技术快速迭代的今天，推理框架的选择直接影响模型部署效率与业务落地成本。本文从核心技术、性能表现、硬件适配、适用场景四大维度，对比分析 vLLM、SGLang、LMDeploy 与

cxl Published on 2025-05-11

技术 #ai #sglang

SGLang常用命令

记录一下在网上搜罗的平常使用SGLang中可能会经常用到的一些命令以及选项一、基础配置

cxl Published on 2025-05-10

技术 #ai #sglang

探索SGLang：开源跨平台大模型工具的无限可能

SGLang 是一款面向大语言模型（LLM）和视觉语言模型（VLM）的高性能开源推理引擎，通过协同优化后端运行时与前端语言接口，显著提升模型推理效率和开发灵活性。核心特点与技术亮点

cxl Published on 2025-05-09

技术 #ai #lmdeploy

LMDeploy常用命令

记录一下平时在使用LMDeploy中可能会经常用到的一些命令以及选项一、核心子命令功能架构 lmdeploy serve ├── api_server # API服务部署核心模块 ├── gradio # 网页交互界面生成模块 ├── api_client

cxl Published on 2025-04-20

技术 #ai #lmdeploy

探索LMDeploy：开源跨平台大模型工具的无限可能

LMDeploy 是由上海人工智能实验室开发的专为大语言模型（LLM）和视觉-语言模型（VLM）设计的高效部署工具箱，其核心目标是通过压缩、量化和服务化技术降低模型推理成本并提升性能。没错，咱们国人团队开发的，属于国货，made in china!

cxl Published on 2025-04-19

IT #ai #vllm

vLLM：serve常用命令

以下是针对生产环境的vLLM核心命令选项详解（共23个），涵盖显存管理、吞吐优化、量化策略等关键场景，结合企业级最佳实践做个记录一、模型加载与初始化 --model 作用：指定HuggingFace模型路径或名称生产级示例：--model=/models/llama3-70b-awq 关键点：推

cxl Published on 2025-04-18

IT #ai #vllm

探索vLLM：开源跨平台大模型工具的无限可能

在人工智能领域，每一次技术的革新都预示着新的可能性和机遇。继 ollama 之后，VLLM作为新一代开源跨平台大型模型工具，正以其独特的魅力和强大的功能，吸引着全球开发者与研究者的目光。

cxl Published on 2025-04-17

技术 #ai #镜像源 #it

modelscope与huggingface cli 下载模型

modelscope 安装首先，参考文档安装配置Anaconda

cxl Published on 2025-04-09

技术 #ai

ModelScope 与 Hugging Face：AI 模型开发的得力助手

ModelScope：一站式模型服务平台简介 ModelScope，由阿里云推出，是一个致力于为开发者提供一站式模型服务的平台。它涵盖了自然语言处理、计算机视觉、语音识别等多个领域的丰富模型库，开发者可以方便地在平台上搜索、调用、微调各类模型，大大简化了从模型选型到部署应用的流程。功能特点丰富

cxl Published on 2025-04-08

技术 #ollama #ai #运维

Ollama接口API

以下内容为github页面中的翻译内容，可能有部分出入，请以最终的实践结果为准！！！ Ollama API 文档接口：生成文本补全 POST /api/generate

cxl Published on 2025-03-19

Menu

All Tags

大模型推理框架深度对比：vLLM、SGLang、LMDeploy与Ollama的架构特性与场景适配

SGLang常用命令

探索SGLang：开源跨平台大模型工具的无限可能

LMDeploy常用命令

探索LMDeploy：开源跨平台大模型工具的无限可能

vLLM：serve常用命令

探索vLLM：开源跨平台大模型工具的无限可能

modelscope与huggingface cli 下载模型

ModelScope 与 Hugging Face：AI 模型开发的得力助手

Ollama接口API

Anaconda安装

linux时间

Nginx安装

Mysql管理

python源

同步工具：rsync

jar包启动脚本

高通在全球三大洲指控 Arm 垄断反竞争，芯片架构授权模式面临重构

SSH 免登录

Jenkins远程部署脚本