当前位置: 首页 > news >正文

VLLM专题(三十一)—架构概述

本文档提供了vLLM架构的概述。

1. 入口点

vLLM 提供了多个与系统交互的入口点。下图展示了它们之间的关系。
在这里插入图片描述

1.1 LLM 类

LLM 类提供了用于进行离线推理的主要 Python 接口,即在不使用单独的模型推理服务器的情况下与模型进行交互。

以下是 LLM 类的使用示例:

from vllm import LLM, SamplingParams

# Define a list of input prompts
prompts = [
    "Hello, my name is",</

相关文章:

  • doris:审计日志
  • C#通过SignalR直接返回流式响应内容
  • 【RabbitMQ】RabbitMQ中死信交换机是什么?延迟队列呢?有哪些应用场景?
  • 【vue3+vant】移动端 - 部门树下拉选择组件 DeptTreeSelect 开发
  • Vue3 界面设计插件 microi-pageengine 入门教程一
  • MyBatis 学习经验分享
  • 责任链模式:优雅处理请求的设计艺术
  • Docker运行Mysql异常:Operation not permitted
  • OceanBase 读写分离最佳实践
  • ADB三个模块介绍
  • C# HTTP认证方式详解与代码实现
  • Docker 最佳实践(MySQL)
  • [spring] Spring JPA - Hibernate 多表联查 1
  • K8S学习之基础三十三:K8S之监控Prometheus部署程序版
  • 【蓝桥杯python研究生组备赛】005 数学与简单DP
  • windows安装金仓V9初始化数据库失败
  • Grid 布局实现三栏布局
  • Vue3:构建高效用户界面的利器
  • VUE中使用路由router跳转页面
  • HTTP请求方法详解:GET、POST、PUT在微信小程序中的应用
  • 深一度|在亚马尔的天才面前,姆巴佩戴上“帽子”又如何
  • 欧阳娜娜担任江西吉安文化旅游大使
  • 高龄老人骨折后,生死可能就在家属一念之间
  • 4月证券私募产品备案量创23个月新高,股票策略占比超六成
  • 正荣地产:董事会主席、行政总裁辞任,拟投入更多精力推动境内债重组等工作
  • 大四本科生已发14篇SCI论文?重庆大学:成立工作组核实