当前位置: 首页 > news >正文

大模型应用开发大纲

AI大模型学习路径脑图结构

一、AI及LLM基础

学习目标:建立对AI和LLM的基础理解,了解主要的机器学习和神经网络模型,掌握API调用方法。

  • 1.1 AI领域基础概念
    • AI, NL/NLU/NLG
    • 机器学习: 学习方法, 拟合评估
    • 神经网络: CNN, RNN, Transformer
    • Transformer, BERT架构简介
    • LLM, Generative AI
    • OpenAI及其他常用大模型介绍
    • 参数详解
    • API Key OpenAI API调用
  • 1.2 OpenAI开发
    学习目标:学会使用OpenAI API开发聊天机器人,理解API的参数和计费,掌握不同API调用方法。
    • OpenAI API参数, Token, 计费
    • Rest API调用(Postman)
    • Python API调用
    • 开发控制台循环聊天
    • 管理对话token
  • 1.3 支持多模态输入的AI Chatbot App
    学习目标:开发支持图片等多模态输入的Chatbot应用,优化代码结构以提高开发效率。
    • 开发基于Streamlit和OpenAI大模型的Chatbot App
    • 支持图片的多模态输入
    • Python项目代码结构优化
  • 1.4 Prompt Engineering提示词工程
    学习目标:学习如何设计高效的Prompt以获得最佳模型输出结果,深入掌握Prompt Engineering技巧,提升与大模型的交互质量。
    • Prompt engineering介绍
    • 最佳实践
    • Zero-shot, Few-shot, CoT, ReAct, Reflexion
    • Prompt Chaining
    • 结构化输出

二、LangChain开发

学习目标:掌握LangChain的高级工具与RAG 和Agent技术,能够构建复杂的AI应用。

  • 2.1 LangChain基础
    学习目标:掌握LangChain的基本用法,理解如何在复杂任务中使用该框架
    • LangChain模块和体系
    • LLM & Chat models
    • PromptTemplates, OutputParses, Chains
    • LLM apps debug
  • 2.2 LangChain Chat Model
    学习目标:能够使用LangChain开发具有记忆功能的Chatbot。
    • Prompt templates: Few shot
    • 为Chain添加Message history (Memory)
    • 基于LangChain的Chatbot
  • 2.3 LangChain Tools & Agent
    学习目标:深入学习LangChain的工具和Agent,包括数据处理、任务管理、插件使用等。
    • Multimode集成
    • Ouput parsers: JSON, XML, YAML
    • 自定义Tools, 调用Tools
    • 创建和运行Agent
  • 2.4 Embedding & Vector Store
    学习目标:掌握如何使用Embedding模型和向量数据库进行高效的信息检索
    • Embedding models
    • Vector stores向量数据库
    • 基于LangChain构建向量存储和查询
  • 2.5 RAG专题
    学习目标:理解RAG工作机制,学会使用文档加载器和文本分割器处理数据,学习如何结合检索和生成模型来处理复杂的任务。
    • RAG简介
    • Document loaders & Text splitters
    • Loader, Splitter, Embedding等综合应用
  • 2.6 自定义组件专题
    学习目标:掌握回调处理和自定义模型的开发。学会自定义组件以满足特定需求,增强模型的灵活性和功能性。
    • Callback 处理
    • 自定义 callback handlers
    • 自定义 Chat model
    • 自定义 RAG: Retriever, document loader
  • 2.7 基于LangChain的常用案例实战
    学习目标:掌握使用LangChain处理实际问题的方法,包括文档问答、数据查询和集成网络搜索功能
    • PDF 文档问答
    • 基于 Web URL 的问答
    • 基于 SQL 的 CSV 数据分析问答
      Web Search 集成
  • 2.8 带RAG的Chatbot实战
    学习目标:构建一个具有复杂对话记录处理能力的Chatbot。
    • Chatbot Memory, RAG, Tools 大对话记录处理
  • 2.9 LangGraph开发实战
    学习目标:掌握LangGraph的应用,理解如何通过图结构来增强模型的推理能力,学会构建复杂的多智能体系统。
    • LangGraph 核心组件: Graphs, State, Nodes, Edges, Send…
    • LangGraph 实现:可控性 Agent 框架, 持久化, Human-in-the-loop, streaming, React agent
    • Agent 使用案例: Chatbots, Multi-Agent Systems, RAG, Planning Agent…

三、LlamaIndex开发

  • 3.1 LlamIndex框架
    学习目标:掌握LlamaIndex的核心模块和应用构建。
    • 与 LangChain 框架对比
    • 核心模块介绍: Models, Prompts, Loading, Indexing, Storing, Quering, Agent, Evaluation
    • RAG pipeline 构建: Loading, Indexing, Querying, Evaluating Agent 构建
  • 3.2 基于LlamIndex框架的应用
    学习目标:基于LlamaIndex框架开发大规模文本搜索和内容推荐系统。
    • 大规模文本数据搜索内容推荐
    • AI 问答
    • LlamaIndex 与 LangChain 集成
    • LlamaIndex RAG CLI 工具

四、AutoGen开发

  • 4.1 AutoGen Studio
    • AutoGen Studio UI
    • Python集成workflow
  • 4.2 AutoGen Framework
    • 快速入门
    • LLM配置
    • Agent类型与Code Executors自动化代码

五、LLM大模型训练与微调

学习目标:具备大模型的训练与调优能力,能够开发和优化适用于特定领域的AI模型

  • 5.1 模型即服务共享平台
    学习目标:学会使用共享平台和本地环境开发和部署大型语言模型。
    • Hugging Face, ModelScope 平台功能
    • 加载在线模型, 离线模型
    • 模型推理调用
    • Transformers 使用,利用模型完成任务:文本,语音,Embedding Models
  • 5.2 私有部署本地大模型
    学习目标:掌握本地大模型的安装部署和调用
    • 硬件配置分析(推理和微调)
    • 常用大模型选型: LlaMA 3, Gemma, Mistral…
    • 本地大模型安装部署
    • 本地大模型调用
    • 本地大模型与对话 APP 应用集成
  • 5.3 训练自己的大模型
    学习目标:深入理解Transformer模型的工作原理,掌握大模型的训练流程和评估,量化技术。
    • Transformer 模型详解, Encoder, Decoder
    • 制作和加载数据集(训练、验证、测试)
    • 模型训练Train (单卡, 多卡),分布式训练
    • 模型评估:方法论、评估指标
    • 模型量化: AWQ, GPTQ, GGUF
    • 模型部署
    • API 调用
  • 5.4 大模型微调
    学习目标:掌握基于预训练模型的微调技术,针对特定领域进行模型的训练与优化,构建专属行业模型。
    • 构建专属行业模型: 基于预训练大模型 Fine-tune
    • 微调对比: 提示工程, RAG, Fine-tuning 对比
    • Prompt Tuning, Prefix-Tuning, LoRA, QLoRA
    • 基于 OpenAI Fine-tuning
    • 本地大模型的 Fine-tuning
    • 特定任务的大模型推理和训练实践: 文本分类, 序
    • 列标注, 文本生成, 图像分割
  • 5.5 特定任务的模型微调训练
    • 基于BERT的中文评价情感分析
    • 如何处理超长文本训练问题
    • GPT2-中文生成模型定制化微调训练
    • GPT2-中文生成模型定制化内容输出
    • LlaMA3大模型本地部署与调用
    • 使用自定义数据集和LlaMA-Factory完成LlaMA3微调训练
    • LlaMA3 LoRA微调测试评估、模型合并、量化
    • LoRA微调后的模型部署
  • 5.6 多模态大模型使用
    • 多模态大模型基本概念
    • 本地部署CogVideoX-5B文生视频模型
    • Llama 3.2-Vision模型架构剖析
    • Llama 3.2-Vision模型预期用途
    • 使用ollama部署Llama-3.2-11B-Vision-InstructGGUF实现视觉问答

六 企业级项目实战

学习目标:通过企业级真实项目场景落地,锤炼大模型全栈技术应用能力。完成AI应用从策划到开发到落地的全过程。

  • RAG项目实战(基于 LlamaIndex 构建企业私有知识库)
  • 基于本地大模型的在线心里问诊系统(微调项目)
  • 六 企业级项目实战

学习目标:通过企业级真实项目场景落地,锤炼大模型全栈技术应用能力。完成AI应用从策划到开发到落地的全过程。

  • 基于 LlamaIndex 构建企业私有知识库(RAG项目实战)
  • 基于本地大模型的在线心里问诊系统(微调项目)
  • 基于YOLO的骨龄识别项目(视觉项目)
  • 企业业招标采购客服系统(RAG+微调项目)
  • 基于大模型的语音唤醒项目实战

七 MCP 接口统一协议

  • mcp 技术入门实战
  • mcp技术入门介绍
  • Funtion calling 和agent 和MCP的区别
  • mcp客户端client介绍和创建
  • mcp服务端端介绍和创建
  • client接入server流程
  • 实时查询天气查询开发
  • mcp生态介绍
  • mcp生生产项目1-通过接口文档生产代码
  • mcp 生产生产生产项目2 -自然语言查询操作数据库mysql

相关文章:

  • 什么是SPA,SPA与MAP区别
  • alibaba-JSONObject使用
  • 数据库优化
  • 全球首个人形机器人半程马拉松技术分析:翻车名场面背后的突破与挑战
  • Java第五节:继承thread类创建线程
  • C语言高频面试题——strcpy与memcpy区别
  • 江湖密码术:Rust中的 bcrypt 加密秘籍
  • NestJS-Knife4j
  • Java Lambda表达式指南
  • 深入理解路由器、IP地址及网络配置
  • 【SF顺丰】顺丰开放平台API对接(Java对接篇)
  • 科大讯飞Q1营收46.6亿同比增长27.7%,扣非净利同比增长48.3%
  • 全排列问题cpp
  • OOA-CNN-LSTM-Attention、CNN-LSTM-Attention、OOA-CNN-LSTM、CNN-LSTM四模型多变量时序预测一键对比
  • 代码随想录算法训练营Day32
  • css3新特性第五章(web字体)
  • 推荐系统/业务,相关知识/概念2
  • Vue 3 Proxy 响应式工作原理
  • Python常用的第三方模块之二【openpyxl库】读写Excel文件
  • Python爬虫实战:获取海口最近2周天气数据,为出行做参考
  • 全国总工会成立100周年,工运历史和发展成就展将对外展出
  • 旁白丨还在寻亲路上的家长们,期待“上岸”
  • 云南巧家警方抓获一名网逃人员:带70余万现金“隐居”山洞,昼伏夜出
  • 上海之旅相册②俄罗斯Chaika:客居六年,致上海的情书
  • 讲座|在数字化时代,“记住”到底意味着什么
  • 中远海运:坚决反对美方对中国海事物流及造船业301调查的歧视性决定