当前位置: 首页 > news >正文

AI日报 - 2025年04月19日

🌟 今日概览(60秒速览)
▎🤖 AGI突破 | OpenAI与Google模型在复杂推理上展现潜力,但距AGI仍有距离;因果AI被视为关键路径。
模型如o3解决复杂迷宫,o4-mini通过棋盘测试,但专家预测AGI仍需30年。
▎💼 商业动向 | 融资活跃,初创公司Mechanize获投欲自动化经济;Meta寻求Llama资助;OpenAI或投资Stargate。
Goodfire获5000万美元A轮融资,Anthropic首次投资;Together AI入选福布斯AI 50强。
▎📜 政策追踪 | 美国签证政策影响科学人才引进受关注;Google被裁定垄断在线广告技术。
全球首款无需人类复核的AI皮肤癌医疗设备获批,监管迈出新步。
▎🔍 技术趋势 | 多模态、长上下文处理、模型压缩与效率成焦点;RAG系统优化与评估方法持续迭代。
Meta发布多项感知研究成果;vLLM与Novita AI合作提升推理性能;新预训练方法IMM提速扩散模型。
▎💡 应用创新 | AI在蛋白质设计、内容生成、自动化评估、编码辅助、供应链优化等领域加速落地。
Profluent推ProGen3助力药物发现;Runway Gen-4赋能品牌故事;AI工具Icon自动生成广告视频。


🔥 一、今日热点 (Hot Topic)

1.1 OpenAI与Google密集发布新模型,AI能力边界持续拓展 ★★★★★

#模型发布 #OpenAI #Google #AGI潜力 | 影响指数:★★★★★
📌 核心进展:过去数周,OpenAI(o3, o4-mini, 4.1系列)与Google(Gemini 2.5 Pro, Flash 2.5, Gemma 3)等巨头密集发布新一代AI模型,在编码、指令遵循、长上下文处理(如o3在120k token实现100%准确率)、多模态理解和推理方面展现显著进步。同时,更小型的nano/mini模型也同步推出,兼顾性能与效率。
⚡ o3模型能通过工具使用解决复杂问题(如识别照片拍摄地点),o4-mini首次通过复杂棋盘推理测试,显示出潜在的复杂推理和抗幻觉能力。Gemini 2.5 Pro在用户体验改进的同时,处理困难任务表现出色。
💡 行业影响
▸ 加速AI能力迭代,尤其在代码生成、长文本理解和需要复杂推理的任务上,推动应用边界拓展。
▸ 模型性能与成本的权衡更加凸显,小型高效模型(如o4-mini, Flash 2.5)为更广泛部署提供可能。
▸ 引发社区对AGI实现的讨论升温,模型展现出的高级能力(如工具调用、复杂推理)被视为迈向AGI的重要步骤,但也伴随对其真实理解能力的质疑。

“o3是他使用过的最智能模型。如果你不这么认为,可能是因为你没有足够难的问题来测试它。” - anton (AI 爱好者)
“展示2022年12月版的ChatGPT,以便人们可以看到自那以后的技术进步…它现在看起来会显得‘古老’。” - Sam Altman (OpenAI CEO)
📎 尽管模型能力提升显著,但用户反馈(如对Claude代码的沮丧)和评估挑战(如新模型评价分歧、基准测试局限性)依然存在。

1.2 初创公司Mechanize启动,目标直指经济全面自动化 ★★★★☆

#初创公司 #融资 #自动化 #虚拟环境 | 影响指数:★★★★☆
📌 核心进展:由Matthew Barnett、Tamay Besiroglu、Ege Erdil创立的Mechanize宣布启动,获Nat Friedman、Daniel Gross等知名人士投资。公司致力于开发虚拟工作环境、基准和训练数据,以实现经济的全面自动化。
⚡ Mechanize认为AI的大部分价值在于自动化普通劳动任务,而非“数据中心的天才”。当前模型在可靠性、长上下文、代理和多模态方面存在缺陷,阻碍了价值实现。Mechanize旨在通过生产必要的数据和评估来克服这些限制。
💡 行业影响
▸ 开辟了通过构建高保真虚拟环境来训练和评估AI代理的新路径,特别关注复杂、长期的、协作性的现实工作任务。
▸ 将AI自动化的目标从特定任务扩展到“经济全面自动化”,描绘了更为宏大的AI应用蓝图,潜在市场规模达数十万亿美元。
▸ 强调了当前AI模型在实际应用中的局限性,并提出通过强化学习和专用数据集来弥补差距的解决方案。

“AI的大部分价值将来自自动化普通劳动任务…目前的AI模型存在严重缺陷,使得这一巨大价值的大部分无法实现。” - Mechanize 官方声明
📎 Mechanize的创始团队包含知名AI研究者和思想家,其愿景和方法论可能对未来AI研究和投资方向产生影响。

1.3 Anthropic首次投资GoodfireAI,探索Claude模型“思维” ★★★★☆

#投资 #Anthropic #GoodfireAI #模型可解释性 | 影响指数:★★★★☆
📌 核心进展:Anthropic宣布对其首个初创公司投资——GoodfireAI,投资额达5000万美元。Goodfire正在开发名为Ember的通用神经编程平台,旨在提供对任何AI模型内部思考的直接、可编程访问。
⚡ 这笔投资旨在深入研究Anthropic旗下AI模型Claude的思维过程和内部工作机制。Ember平台据称能提供对模型内部状态的直接控制和理解。
💡 行业影响
▸ 标志着大型AI模型公司开始重视并投资于模型可解释性(Interpretability)和内部机制研究的商业化应用。
▸ GoodfireAI的技术若成功,可能为AI对齐(Alignment)、调试和性能优化提供强大的新工具,降低“黑箱”风险。
▸ Anthropic通过投资获取前沿的可解释性技术,有助于提升其模型的安全性、可靠性和竞争力。

(Goodfire的Ember平台)提供对任何AI模型内部思考的直接、可编程访问。 - Goodfire 官方介绍
📎 此前已有研究(如MUI指标)关注通过机制可解释性评估LLM,Anthropic的投资进一步印证了这一方向的重要性。

1.4 RAG系统优化与评估成研究热点,多项新方法涌现 ★★★☆☆

#RAG #技术优化 #评估方法 #鲁棒性 | 影响指数:★★★☆☆
📌 核心进展:多项研究聚焦于改进检索增强生成(RAG)系统。REBEL提出多标准重新排序方法,平衡相关性与上下文质量,提升答案质量。另一研究揭示RAG对语言风格变化(如非正式、语法错误)的脆弱性,检索环节是薄弱点。SEE框架则通过专家序列集成解决LLM持续微调中的遗忘问题。
⚡ REBEL使用思维链提示和加权次要标准(深度、权威性等)优化排序;语言风格脆弱性研究发现检索召回率可下降40%;SEE框架让专家模型同时负责任务执行和路由。
💡 行业影响
▸ RAG系统从单纯追求检索相关性,转向更综合的质量评估和优化,如上下文深度、权威性、时效性等。
▸ RAG系统的鲁棒性成为新的研究重点,未来模型需更能适应现实世界中多变的语言风格和噪声。
▸ 持续学习和知识更新能力对于RAG系统至关重要,类似SEE的框架为模型在不遗忘旧知识的情况下学习新任务提供了思路。
📎 这些研究表明,提升RAG系统性能不仅需要改进检索或生成单一环节,更需要系统性的优化、鲁棒性设计和持续学习能力。


🛠️ 二、技术前沿 (Tech Radar)

2.1 因果AI (Causal AI)

⌛ 技术成熟度:研究与初步应用阶段
核心创新点
超越预测,探究原因:不仅预测“会发生什么”,更关注“为什么发生”,寻找数据间的因果关系而非仅仅是关联。
支持反事实推理:能够探索“如果…会怎样”的情景,评估不同干预措施的效果,解释结果。
构建干预策略:基于因果理解,设计更有效的干预措施以改善结果,应用于商业决策、政策制定等。
📊 应用前景:被认为是迈向AGI的关键一步,有望与基础AI、生成AI融合形成复合AI,在医疗、金融、市场营销等领域带来更深层次的洞察和决策支持。

2.2 Meta FAIR 多项感知与语言模型研究成果

🏷️ 技术领域:计算机视觉/自然语言处理/多模态/3D视觉
技术突破点
Meta Perception Encoder:大规模视觉编码器,在多项图像和视频任务中表现出色,提升视觉理解基准。
Meta Perception Language Model:完全开放可复现的视觉语言模型,专注解决视觉识别任务,推动开放研究。
Meta Locate 3D:端到端模型,通过自然语言描述在3D环境中精确定位物体,刷新引用接地基准,适用于机器人、AR等实时设备。
Byte Latent Transformer (BLT):发布7B/1B模型权重,用熵模型替代传统分词器,探索语言模型效率和可靠性的新范式。
🔧 落地价值:这些研究为更高效、准确的AI系统铺平道路,特别是在需要深度视觉理解、3D空间感知和新型语言表示的场景。

2.3 IMM (Inductive Moment Matching) 扩散模型预训练

🔬 研发主体:Luma AI
技术亮点
突破算法天花板:提出新的扩散模型预训练方法,显著提升生成样本质量。
跳过去噪步骤:通过将目标时间步添加到输入中,使模型直接预测目标状态,简化生成过程。
速度大幅提升:生成速度比现有SOTA方法快10倍,同时保持或提升质量。
🌐 行业影响:可能改变扩散模型的训练和推理范式,使得高质量图像/视频生成更快、更高效,降低应用门槛。

2.4 DISCIPL (Self-Steering Language Models)

🏷️ 技术领域:自然语言处理/模型推理/受限生成
技术突破点
规划器-追随者架构:规划器LLM生成自定义推理程序,指导多个小型追随者LLM高效、可验证地解决任务。
小模型超越大模型:使小型追随者模型(如1B参数)在困难的受限任务上达到甚至超越大型模型(如GPT-4o)的性能。
可验证与高效:明确的推理程序提供逐步控制,确保满足约束条件;并行蒙特卡洛搜索提高效率。
🔧 落地价值:为在资源受限环境下部署高性能LLM提供了新思路,尤其适用于需要严格约束满足和复杂推理的场景,降低对超大模型的依赖。


🌍 三、行业动态 (Sector Watch)

3.1 AI 药物发现与蛋白质设计

🏭 领域概况:AI正在加速从靶点识别到候选药物设计、临床试验优化的全流程。蛋白质生成模型是近期热点。
核心动态:Profluent推出460亿参数的蛋白质生成模型ProGen3,已成功设计出性能匹配现有疗法的抗体 (OpenAntibodies) 和超紧凑Cas蛋白。DeepMind CEO预测AI能在10-15年内解决所有疾病,强调AI加速科学发现。
📌 数据亮点:ProGen3训练数据达1.5万亿标记,并在湿实验室获得验证。
市场反应:生物科技公司和大型制药企业积极拥抱AI,初创公司融资活跃。
🔮 发展预测:蛋白质/分子生成模型将继续突破,与自动化实验平台结合,大幅缩短药物研发周期。个性化精准医疗是长期方向。

3.2 AI 辅助编码与开发者工具

🚀 增长指数:★★★★☆
关键进展:开发者对AI编码助手(如Claude Code, Codex)依赖性增强,尽管存在挫败感。OpenAI、Google等发布新模型,提升编码能力。开源Codex与LLaMA 3.3结合测试显示潜力。新工具如Open-Codex支持多AI提供商。CodeGen AI助手在团队贡献中排名靠前。
🔍 深度解析:AI编码工具正从代码补全向更复杂的任务(如编写测试、代码重构、自动化研究流程)演进。用户体验、模型推理能力、与开发流程的集成是关键。
产业链影响:改变软件开发流程,提高开发效率,降低编程门槛。对传统IDE、代码托管平台(如GitHub集成代理)提出新要求。
📊 趋势图谱:AI代理将更深入地融入开发工作流,从辅助编码向自动化软件工程任务演变。模型的可解释性和可控性需求增加。

3.3 AI 驱动的自动化与机器人

🌐 全球视角:美国和中国在该领域竞争激烈,关注点包括AGI/ASI、聚变发电和机器人量产。
区域热点:中国将机器人技术融入大规模生产,强调文化变革和全民参与。特斯拉Optimus机器人持续迭代,展示人形机器人进展。WPP与Boston Dynamics合作,让Atlas机器人担任摄像师。
💼 商业模式:Mechanize代表了通过虚拟环境训练实现全面自动化的新思路。特斯拉以自动驾驶切入,目标Robotaxi。
挑战与机遇:实现通用物理任务的挑战依然巨大。人形机器人成本、可靠性、安全性是关键。自动化带来的经济增长和社会结构变化是长期议题。
🧩 生态构建:涉及硬件(机器人本体、传感器)、软件(控制算法、AI模型)、模拟环境、数据和应用场景的复杂生态系统。

📈 行业热力图(基于附件信息评估):

领域融资热度政策支持技术突破市场接受度
AI药物发现▲▲▲▲▲▲▲▲▲▲▲▲▲
AI医疗诊断▲▲▲▲▲▲▲▲▲▲▲▲▲
AI编码辅助▲▲▲▲▲▲▲▲▲▲▲
机器人与自动化▲▲▲▲▲▲▲▲▲▲▲▲▲
AI内容生成(文/图/音/视频)▲▲▲▲▲▲▲▲▲▲▲▲▲▲
金融科技AI▲▲▲▲▲▲▲▲▲▲▲
供应链AI▲▲▲▲▲▲▲▲

💡 行业洞察:内容生成、药物发现、编码辅助和机器人自动化是当前技术突破和商业关注的热点领域。医疗诊断领域政策支持力度大。


🎯 四、应用案例 (Case Study)

4.1 Runway Gen-4 赋能虚构品牌故事创作

📍 应用场景:利用AI生成图像和视频,为虚构网球品牌"Dropshot"创建完整的品牌故事视觉内容。
实施效果

任务AI实现方式效果展示
品牌视觉生成Gen-4生成所有图片和视频内容成功创建统一风格的品牌视觉资产
动态效果增强将运动融入静态照片为品牌资产增添动态维度,提升吸引力
品牌故事可视化使用色调视频呈现叙事有效传达品牌理念和故事
模型图生动化让静态模型图动起来增强产品或概念展示的生动性

💡 落地启示:展示了AI视频/图像生成工具在品牌营销、创意内容制作方面的巨大潜力,能够低成本、高效率地实现从概念到视觉呈现。
🔍 技术亮点:Runway Gen-4的多模态生成能力,能够根据文本提示生成高质量、风格一致的图像和视频,并支持对生成内容进行编辑和动态化处理。

4.2 RAG技术助力保险欺诈检测 (EyeLevel & GroundX)

📍 应用场景:处理和分析大量保险索赔文件(高达20,000页),识别潜在的欺诈行为。
价值创造
效率大幅提升:系统能在30秒内处理一个索赔,而传统方法需数百小时。
成本显著降低:单次索赔处理成本仅30美元,远低于人工调查成本。
增强专家能力:通过交叉引用信号和交互式数据探索,辅助专家验证索赔。
解决方案

环节技术应用创新点
文档处理导入数据库,预训练视觉模型理解复杂文档处理大规模、多样化文档格式
初步筛选回答预设问题,识别欺诈信号自动化初步风险评估
深度分析交叉引用多信号,专家交互式数据探索结合AI分析与专家判断
安全部署GroundX平台支持完全本地运行,无需联网确保数据安全与隐私

💡 推广潜力:该模式可应用于需要处理大量文档、识别异常模式的金融、法律、合规等领域。

4.3 Portola AI角色Tolan:情感陪伴与商业成功

📍 行业背景:AI伴侣市场兴起,用户寻求情感连接和个性化交互。
解决方案
个性化塑造:通过轻量级性格测验(Big Five, Myers-Briggs)收集用户信息,塑造既熟悉又有趣的AI角色。
即兴交互:训练Tolan进行即兴表演而非遵循脚本,灵感来自《Impro》,通过情境积累“生活经历”。
低延迟响应:优化响应时间(目标2秒内),确保流畅沉浸的语音交互体验。
效果评估

业务指标结果/数据评估
年收入预测预计达400万美元商业模式验证,增长迅速
用户增长ARR在一个月内增长四倍 (TikTok/Ins推动)病毒式营销成功,市场接受度高
用户体验旨在帮助用户从不知所措到踏实关注情感价值和用户心理健康

💡 行业启示:展示了AI在情感陪伴和新型创意媒介方面的潜力,成功的关键在于个性化、即兴能力和低延迟交互。强调AI可以成为增强人类福祉的工具(“白镜”技术)。
🔮 未来展望:探索AI作为故事讲述媒介的更多可能性,进一步提升交互的真实感和情感深度。


👥 五、AI人物 (Voices)

5.1 Yann LeCun (Meta首席AI科学家)

👑 影响力指数:★★★★★

“我不再对大型语言模型(LLMs)感兴趣了,它们属于过去。有四个更有趣的领域:能够理解物理世界的机器、持久记忆、推理以及规划。”
观点解析
LLM局限性:认为当前LLM范式已达瓶颈,无法实现真正的理解和推理,尤其是在物理世界交互方面。
未来方向:指明了AI研究的四大前沿:世界模型(物理理解)、记忆机制、高级推理能力和目标导向的规划能力,这些被视为通向更强AI的关键。
📌 背景补充:LeCun是深度学习先驱之一,长期倡导基于世界模型的AI架构(如其提出的JEPA),此番言论重申了他对超越自回归LLM的追求。

5.2 Sam Altman (OpenAI CEO)

👑 影响力指数:★★★★★

提议展示2022年12月版ChatGPT以展示进步;承诺"我们将努力创造更美的AI作品" (回应用户对o3的赞美)。
行业影响
展示AI发展速度:通过对比新旧版本,强调AI技术的快速迭代和能力提升,增强市场信心。
设定美学与能力目标:将“美”作为AI创造的目标之一,暗示未来模型不仅追求功能强大,也可能涉及更高层次的创造力和审美体验。
📌 深度洞察:Altman的言论常常被视为OpenAI战略方向和市场预期的风向标。他对o3/o4系列模型的自信以及对未来(可能指GPT-5/O5)的暗示,维持了OpenAI在AI竞赛中的领先形象。

5.3 Andrew Ng (DeepLearning.AI创始人, Stanford教授)

👑 影响力指数:★★★★☆

*“许多生成式AI(GenAI)应用项目在自动化评估(evals)系统的输出上投入较晚,且过度依赖人类判断…可以通过迭代过程逐步完善。” *
观点解析
早期自动化评估:强调在GenAI项目早期就引入自动化评估系统的重要性,即使初期系统不完美。
迭代优化:建议采用迭代方法,从简单、不完美的评估开始,逐步将评估负担从人类转移到自动化系统。
📌 背景补充:Ng强调评估系统如同机器学习中的错误分析,其核心价值在于准确反映系统性能差异,指导模型改进。这一观点为GenAI项目的工程实践提供了重要指导。

5.4 Jeff Dean (Google DeepMind首席科学家)

👑 影响力指数:★★★★☆

将在ETH Zürich发表演讲,探讨“AI如何发展至今、现在能做什么以及如何塑造AI的未来”。
行业影响
权威视角:作为Google AI的领军人物,Dean的演讲将提供对当前AI技术格局和未来趋势的权威解读。
方向指引:其对AI发展路径和塑造未来的看法,可能影响研究界和产业界的关注焦点。
📌 前瞻视角:Dean长期参与和领导Google的AI研究,其观点对于理解大型科技公司在AI领域的战略布局和技术路线具有重要参考价值。


🧰 六、工具推荐 (Toolbox)

6.1 Mistral Classifier Factory

🏷️ 适用场景:内容审核、意图检测、情感分析、数据聚类、欺诈检测、垃圾邮件过滤、推荐系统等分类任务。
核心功能
简化分类器开发:提供简单友好的方式构建自定义分类器。
高效模型:利用Mistral AI小型但高效的模型和训练方法。
提供示例代码:发布了意图分类、内容审核、产品分类等cookbook。
使用体验:(未直接提及,但强调“简单友好”)
🎯 用户画像:需要快速构建和部署定制化文本分类功能的企业和开发者。
💡 专家点评:利用小型高效模型降低了定制分类器的门槛,拓展了Mistral AI在实用工具层面的布局。

6.2 Runway Gen-4

🏷️ 适用场景:品牌故事创作、视觉特效、广告制作、艺术创作、模型图动态化。
核心功能
图像生成:根据文本提示生成高质量图像。
视频生成:根据文本提示或图像生成视频内容。
运动融入照片:为静态图像添加动态效果。
色调视频:用于可视化品牌故事或特定氛围。
使用体验:(用户反馈积极,称其能独立完成从A到Z的创作)
▸ (易用性评分:★★★★☆ - 基于用户反馈)
🎯 用户画像:创意工作者、营销人员、电影制作人、视觉艺术家。
💡 专家点评:作为领先的AI视频生成工具之一,Gen-4在品牌叙事和视觉创意方面展现了强大能力,并提供了如反向播放等实用技巧。

6.3 Tencent InstantCharacter

🏷️ 适用场景:游戏开发、动画制作、虚拟形象创建、个性化内容生成。
核心功能
个性化角色生成:基于单张参考图像生成高质量、风格一致的角色图像。
可扩展框架:基于可扩展扩散变换器框架构建。
易于操作:允许用户通过简单操作生成角色。
使用体验:(未直接提及,但强调“简单操作”)
🎯 用户画像:游戏开发者、动画师、设计师、需要快速生成一致性角色的创作者。
💡 专家点评:腾讯在AI生成内容领域的最新进展,专注于角色生成这一垂直领域,满足了特定行业对高效、一致性角色资产的需求。 (现已集成到FAL平台)

6.4 SkyPilot

🏷️ 适用场景:跨云/集群运行AI/ML作业,解决GPU资源短缺和成本优化问题。
核心功能
多区域资源池化:统一多个云基础设施(不同区域、不同云商、K8s、本地)为一个计算池。
自动化调度与优化:自动选择最便宜、可用的资源,绕过容量限制。
显著提升效率与成本效益:官方基准测试显示时间缩短近9倍,成本降低61%。
使用体验
▸ (抽象化云差异,简化部署:★★★★☆)
▸ (成本与效率优化:★★★★★)
🎯 用户画像:机器学习工程师、数据科学家、需要大规模GPU资源进行模型训练或推理的团队。
💡 专家点评:解决了AI/ML工作负载中常见的GPU资源瓶颈和成本痛点,通过智能调度和资源池化大幅提升了基础设施利用效率。


🎩 七、AI趣闻 (Fun Corner)

7.1 Atlas机器人当摄像师

🤖 背景简介:WPP与Boston Dynamics及Canon合作,让Atlas人形机器人担任摄像师。
有趣之处
▸ 人形机器人执行需要精细操作和稳定性的创意任务。
▸ Atlas能够实现“针尖般精准”的拍摄,并确保人类摄制组的安全。
延伸思考
▸ 展示了先进机器人在非结构化环境和复杂任务中的潜力,未来可能替代更多人类工种。
📊 社区反响:引发对机器人能力边界和未来人机协作模式的讨论。

7.2 开发者与Claude Code的“爱恨情仇”

🤖 背景简介:一位开发者表达了对Claude代码输出的极度沮丧(“想走进大海”),但同时承认离不开它(“不再愿意在没有它的情况下工作”)。
有趣之处
▸ 生动体现了当前AI编码助手虽然能力强大,但在可靠性、准确性方面仍有不足,让用户又爱又恨。
▸ 对比Codex,指出其虽然界面相似但功能不同,且o4-mini的推理能力是其优势之一。
延伸思考
▸ AI工具与人类用户之间的磨合过程,以及用户对工具性能和易用性的高要求。
📊 社区反响:引发了其他开发者对使用AI编码工具体验的共鸣和讨论。

7.3 1947年发现的第一个“计算机Bug”

🤖 背景简介:Grace Hopper团队在Harvard Mark II计算机中发现一只导致故障的飞蛾。
有趣之处
▸ “Bug”一词的字面起源,源于一个真实的物理昆虫。
▸ 展示了早期计算机的物理脆弱性和维护的挑战。
延伸思考
▸ 科技术语的有趣来源,以及问题排查(Debugging)在计算机科学中的悠久历史。
📚 延伸阅读:Grace Hopper的传记或早期计算机历史资料。

7.4 AI实时口音转换:班加罗尔秒变加州

🤖 背景简介:AI技术(如Krisp, Sanas)现可实时转换说话者的口音。
有趣之处
▸ 班加罗尔呼叫中心员工的声音可以实时听起来像加州本地人。
▸ 技术不仅改变发音,还可能涉及语调、节奏的模仿。
延伸思考
▸ 对跨文化交流、客户服务行业可能产生的影响(利弊皆有)。
▸ 关于身份认同、语言多样性和技术伦理的讨论。
📊 社区反响:引发对技术能力的好奇,以及对其潜在社会影响的讨论。


📌 每日金句

💭 今日思考:我不再对大型语言模型(LLMs)感兴趣了,它们属于过去。有四个更有趣的领域:能够理解物理世界的机器、持久记忆、推理以及规划。
👤 出自:Yann LeCun (Meta首席AI科学家)
🔍 延伸:这句话挑战了当前以LLM为中心的AI主流范式,指明了通向更通用、更强大人工智能可能需要突破的关键方向,即赋予AI对物理世界的理解、长期记忆、深度推理和自主规划能力。

相关文章:

  • 网络基础(协议,地址,OSI模型、Socket编程......)
  • Linux网络编程 TCP---并发服务器:多进程架构与端口复用技术实战指南
  • GO语言入门:常用数学函数2
  • TCVectorDB 向量数据库简介
  • K8s-Pod详解
  • 操作系统是如何运行的?
  • 2014-2021年 区域经济高质量发展-高质量需求指标数据
  • 【Hot100】 240. 搜索二维矩阵 II
  • 微信小程序中使用h5页面预览图片、视频、pdf文件
  • 软考复习——知识点软件开发
  • 深入理解Java包装类:自动装箱拆箱与缓存池机制
  • Linux操作系统--进程的创建和终止
  • 缓存 --- Redis的三种高可用模式
  • 重构之去除多余的if-else
  • Kubernetes相关的名词解释Dashboard界面(6)
  • 年化26.9%的稳健策略|polars重构因子计算引擎(python策略下载)
  • 03【变量观】`let`, `mut` 与 Shadowing:理解 Rust 的变量绑定哲学
  • c++STL——list的使用和模拟实现
  • go环境安装mac
  • 02【初体验】安装、配置与 Hello Cargo:踏出 Rust 开发第一步
  • 《大家聊中国式现代化》明天全网推出
  • 语言天才、魔方大师,击败王楚钦前他豪言:我能比中国球员强
  • 特朗普就防卫负担施压日本,石破茂:防卫费应由我们自主决定
  • 河南社旗县委书记张荣印转任南阳市人大常委会农工委主任
  • 美国防部宣布整合驻叙美军部队,将减少至不足千人
  • 财政部:一季度证券交易印花税411亿元,同比增长60.6%