当前位置：首页 > news >正文

[DeepSeek]二、大模型

news 来源：原创 2025/4/29 5:31:16

1. 大模型介绍

大模型，全称[大语言模型]，Large Language Model，缩写LLM，是一种基于机器学习和自然语言处理技术的模型，他通过对大量的文本数据进行训练，来学习服务人类语言理解和生成的能力。

对话产品和基座大模型实际上是两个东西。

2. 大模型和通用人工智能

通用人工智能的定义：AGI

指的是一种能够理解、学习和应用知识和技能，在任何人类智能能够执行的广泛任务上表现得和人类一样好，甚至更好。AGI是一个未来的目标，目前尚未实现，它需要能够处理极其广泛的问题和环境，具有很高的适应性、自主性和创造性。

LLM和AGI的关联：

研究基础：当前的大模型是通向AGI的一种可能得研究途径。通过开发和训练大模型，研究者可以探索智能行为的各个方面，包括语言理解、问题解决和学习能力。例如，通过改进算法、增加模型的泛化能力，以及探索更有效的学习方法，大模型可以逐步接近AGI的特性。

技术搭桥：大模型在处理复杂任务时展示的能力可能为发展通用人工智能提供技术基础。

实验平台：大模型提供了一个实验平台，研究者可以在这些平台上测试不同的理论和方法，看他们在实际应用中的表现如何，这对于理解和创建AGI至关重要。