当前位置: 首页 > news >正文

初识大模型

一 大模型是什么?

简单说,大模型就像一个超级聪明的“AI大脑”,它通过“读”海量的书、网页、聊天记录等,学会了人类语言的各种规律和知识。

(一)它的特点:
1 “肚子里”装的知识超多:
- 比如读了全互联网的文字(相当于几亿本书),能记住各种常识、故事、甚至专业领域的内容(比如法律、医学)。  
- 不像普通软件只能做一件事(比如计算器算数学、翻译软件翻句子),它学会后能做很多事,比如聊天、写文章、回答问题、生成图片等。
2 会“举一反三” :
- 比如你教它“把‘你好’翻译成英文是‘Hello’”,它不仅能翻译这句话,还能翻译其他句子,甚至能理解不同语言的复杂表达(比如方言、比喻)。  
- 遇到没学过的问题,还能“猜”出答案(虽然不一定全对,但很接近)。
3 越“大”越聪明:
- “大”指的是它“大脑”里的“小零件”(专业上叫“参数”,可以理解为“学习单元”)特别多,比如几百亿、上万亿个。  
- 零件越多,能处理的信息越复杂,比如能记住很长的对话(比如你和它聊100轮,它还能记住前面说过的内容),或者解决复杂的逻辑题(比如数学证明、推理游戏)。

二 人工智能到大模型的演变历程可以分为以下几个阶段:

人工智能发展分几步:

1. 早期:靠人工写规则解决特定问题(比如医疗诊断),但只能处理已知情况,很死板。
  • 实例
    • MYCIN 系统(1970s):靠医生手工编写的 200 多条规则,诊断血液感染病,准确率超人类专家,但只能处理 “已知规则内” 的病,遇到新情况就歇菜。
    • DENDRAL(1960s):用化学规则分析光谱数据,帮科学家推断分子结构,是最早的 “专家系统” 之一,但只能做特定化学分析。

2. 机器学习:用数据训练模型,让AI自己从数据里学规律(比如认图片、听语音),比之前灵活,能处理更多任务。
  • 实例
    • 垃圾邮件过滤(2000s):用 “朴素贝叶斯” 算法,通过分析邮件里的关键词(如 “中奖”“低价”),自动分类垃圾邮件,比人工规则灵活,能适应新词。
    • AlexNet(2012):在 ImageNet 图像识别比赛中,靠深度学习算法,把 “识别 1000 类物体” 的错误率从 26% 降到 15%,第一次让 AI 认图比人准,直接带火深度学习。
3. 深入学语言:AI开始懂文字,能聊天、翻译、写句子,慢慢从简单对话变得会写长文章、回答复杂问题。
  • 实例
    • 谷歌翻译(2016 前用 RNN):早期用 “循环神经网络(RNN)” 逐句翻译,比如中译英,能处理 “语序不同” 的问题(中文 “我吃饭”→英文 “I eat rice”),但长句子容易 “断片”,翻译后面忘前面。

- **BERT(2018)**:靠 “预训练 + 微调”,比如回答 “中国的首都是哪里?”,不用专门教,自己从海量文本里学会 “北京是中国首都”,在 11 个 NLP 任务上刷新纪录,比如阅读理解、情感分析。 

4. 大模型时代:近几年出现超大规模模型,参数千亿万亿级,不用针对每个任务单独训练,能自己理解和生成复杂内容,还能结合文字、图片、声音等(比如聊天、写代码、生成图片),应用特别广。
  • 实例
    • GPT-3(2020):给几个例子就能干活,比如你写 “把‘下雨天要带伞’改成文言文”,它秒回 “逢雨必携伞具”,不用针对 “文言文转换” 单独训练,会自己 “悟” 规律,能写小说、编代码、做数学题。

                 ![](https://i-blog.csdnimg.cn/img_convert/3e483f312763467471ab1cbc86c739a7.jpeg)
      
    • DALL-E 2(2022):输入文字 “一只穿西装的兔子在弹钢琴”,直接生成图,把文字和图像 “打通”,以前 AI 只能单独认图或写字,现在能 “跨模态” 创作。

    • AlphaFold 2(2021):用大模型分析蛋白质序列,预测 3D 结构准确率超 90%,解决了生物学 50 年的难题,以前靠实验测一个结构要几年,现在几小时搞定。

三 大模型

1 预训练(Pre-training)
  • 目的:让模型先“通读天下数据”,学会人类知识的通用规律。
  • 怎么做:用海量无标签数据(比如互联网文本、书籍、网页)喂给模型,让它自己总结语言/图像/声音的基本规则(比如“主谓宾结构”“猫是动物”“红色代表警示”)。
  • 实例
    • GPT-3用5700亿个网页文本训练,学会了“人类语言怎么组词、造句、逻辑关联”,比如输入“下雨天”,它能联想到“要带伞”“路滑”等,这是后续一切能力的基础。
2 SFT(监督微调,Supervised Fine-tuning)**
  • 目的:让模型从“啥都懂一点”变成“会做具体任务”,比如聊天、写邮件、回答问题。
  • 怎么做:用人工标注的“正确答案数据”训练模型,告诉它“遇到这类问题应该这样答”。
  • 实例
    • ChatGPT在预训练后,用人工写好的1.5万条问答对(比如“用户问‘怎么煮奶茶?’,正确回答是‘先煮茶加牛奶…’”)微调,让它学会“用对话的方式回应”,而不是像预训练时只会生成任意文本。
3. RLHF(基于人类反馈的强化学习,Reinforcement Learning from Human Feedback)**
  • 目的:让模型“懂人类偏好”,比如拒绝有害内容、调整回答风格(更礼貌/更简洁)。
  • 怎么做
    1. 人类给模型的多个回答打分/排序(比如用户问“怎么快速减肥?”,模型生成A/B/C三种回答,人类标“B最健康合理,A太极端,C太啰嗦”)。
    2. 模型根据人类的“喜好分数”调整,奖励符合人类预期的回答,惩罚不好的(比如下次遇到类似问题,多生成像B的回答)。
  • 实例
    • 当用户让模型“写一段歧视性言论”,经过RLHF训练的模型会拒绝,并回复“抱歉,我不能这样做”,因为人类在训练中标记了“歧视性内容是坏的”,模型学会了拒绝有害请求。
总结:三步如何配合?
  • 预训练:让模型有“智商”,知道世界常识(比如“地球是圆的”“1+1=2”)。
  • SFT:让模型有“技能”,学会做具体事(比如聊天、写代码、翻译)。
  • RLHF:让模型有“情商”,知道人类喜欢什么、不喜欢什么(比如不说脏话、不传播错误信息)。
    最终让大模型从“傻但知识多”变成“聪明、能干、懂规矩”的实用AI(比如ChatGPT、文心一言等)。

四 大模型的特点

## [😀]规模和参数量大
— 大模型通过其庞大的规模(拥有从数亿到数千亿级别的参数数量)来捕获复杂的数据模式,使得它们能够理解和生成极其丰富的信息。
## [🤖]适应性和灵活性强
— 模型具有很强的适应性和灵活性,能够通过微调(fine-tune)或少样本学习高效地迁移到各种下游任务,有很强的跨域能力。
## [🤠]广泛数据集的预训练
— 大模型使用大量多样化的数据进行预训练,以学习广泛的知识表示,能够掌握语言、图像等数据的通用特征。
## [😏]计算资源需求大
— 巨大的模型规模带来了高昂的计算和资源需求,包括但不限于数据存储、训练时间、能量消耗和硬件设施。

大模型的模态处理能力分类

纯文本大模型(Text-Only LLMs)

处理对象:仅输入输出文本,是最成熟的大模型类型。
典型代表:GPT-3(纯文本)、Llama 2、BERT。

多模态大模型(Multimodal LLMs)

处理对象:支持文本与图像、语音、视频等多模态输入输出,实现跨模态语义对齐。
细分类型:
文本 - 图像交互:GPT-4(支持图像输入 + 文本输出)、Flan-ViT(文本引导图像生成 / 理解);
文本 - 语音交互:Whisper(语音识别 + 生成,OpenAI)、VALL-E(语音合成与情感模拟);
多模态统一模型:GPT-4V(视觉 - 语言理解)、Multimodal-GPT(支持图像、视频、文本混合输入)。

相关文章:

  • OpenAI 焕新力作:ChatGPT 开启“记忆长廊”,对话皆成专属印记
  • 自然语言处理spaCy
  • 多模态融合学习(九)——PIAFusion 武汉大学马佳义团队(一)
  • 指针(1)
  • 短波红外高光谱相机:高光谱成像在塑料分选中的应用
  • PHP + Go 如何协同打造高并发微服务?
  • NAS-RAID方案之snapRAID
  • Spark-SQL简介与编程
  • 4月14日星期一今日早报简报微语报早读
  • 2025年常见渗透测试面试题-红队面试宝典上(题目+回答)
  • AI 项目详细开发步骤指南
  • 构造HTTP请求
  • mapbox V3 新特性,加载风粒子动画
  • VSCode 降低适用版本并且关闭自动更新
  • 代码随想录第17天:二叉树
  • Spring Boot 集成 RocketMQ 全流程指南:从依赖引入到消息收发
  • 【Three.js基础学习】35.Particles Cursor Animation Shader
  • 【笔记】对抗训练-GAN
  • 论文精度:双分支图Transformer网络:视频驱动的3D人体网格重建新突破
  • 记一次某网络安全比赛三阶段webserver应急响应解题过程
  • 又有多地推进产科整合
  • 人民日报:当阅读成为“刚需”
  • 全国首家由司法行政部门赋码登记的商事调解组织落户上海
  • 左眼失明左耳失聪,办理残疾人证被拒?县残联:双眼残疾才能办
  • 日薪100元散发“引流小卡片”,上海浦东警方抓获2名违法人员
  • 二手服装“批发”市集受到年轻人追捧,是哪一股潮流在推动?