陈显林-个人网站 Stay Hungry,Stay Foolish.

大模型推理框架深度对比:vLLM、SGLang、LMDeploy与Ollama的架构特性与场景适配

在大模型技术快速迭代的今天,推理框架的选择直接影响模型部署效率与业务落地成本。本文从核心技术、性能表现、硬件适配、适用场景四大维度,对比分析 vLLM、SGLang、LMDeploy 与

cxl cxl Published on 2025-05-11

SGLang常用命令

记录一下在网上搜罗的平常使用SGLang中可能会经常用到的一些命令以及选项 一、基础配置

cxl cxl Published on 2025-05-10

探索SGLang:开源跨平台大模型工具的无限可能

SGLang 是一款面向大语言模型(LLM)和视觉语言模型(VLM)的高性能开源推理引擎,通过协同优化后端运行时与前端语言接口,显著提升模型推理效率和开发灵活性。 核心特点与技术亮点

cxl cxl Published on 2025-05-09

LMDeploy常用命令

记录一下平时在使用LMDeploy中可能会经常用到的一些命令以及选项 一、核心子命令功能架构 lmdeploy serve ├── api_server # API服务部署核心模块 ├── gradio # 网页交互界面生成模块 ├── api_client

cxl cxl Published on 2025-04-20

探索LMDeploy:开源跨平台大模型工具的无限可能

LMDeploy 是由上海人工智能实验室开发的专为大语言模型(LLM)和视觉-语言模型(VLM)设计的高效部署工具箱,其核心目标是通过压缩、量化和服务化技术降低模型推理成本并提升性能。没错,咱们国人团队开发的,属于国货,made in china!

cxl cxl Published on 2025-04-19

vLLM:serve常用命令

以下是针对生产环境的vLLM核心命令选项详解(共23个),涵盖显存管理、吞吐优化、量化策略等关键场景,结合企业级最佳实践做个记录 一、模型加载与初始化 --model 作用:指定HuggingFace模型路径或名称 生产级示例:--model=/models/llama3-70b-awq 关键点:推

cxl cxl Published on 2025-04-18

探索vLLM:开源跨平台大模型工具的无限可能

在人工智能领域,每一次技术的革新都预示着新的可能性和机遇。继 ollama 之后,VLLM作为新一代开源跨平台大型模型工具,正以其独特的魅力和强大的功能,吸引着全球开发者与研究者的目光。

cxl cxl Published on 2025-04-17

modelscope与huggingface cli 下载模型

modelscope 安装 首先,参考文档 安装配置Anaconda

cxl cxl Published on 2025-04-09

ModelScope 与 Hugging Face:AI 模型开发的得力助手

ModelScope:一站式模型服务平台 简介 ModelScope,由阿里云推出,是一个致力于为开发者提供一站式模型服务的平台。它涵盖了自然语言处理、计算机视觉、语音识别等多个领域的丰富模型库,开发者可以方便地在平台上搜索、调用、微调各类模型,大大简化了从模型选型到部署应用的流程。 功能特点 丰富

cxl cxl Published on 2025-04-08

Ollama接口API

以下内容为github页面中的翻译内容,可能有部分出入,请以最终的实践结果为准!!! Ollama API 文档接口: 生成文本补全 POST /api/generate

cxl cxl Published on 2025-03-19
Previous Next