当前位置: 首页 > news >正文

【程序员 NLP 入门】词嵌入 - 上下文中的窗口大小是什么意思? (★小白必会版★)

🌟 嗨,你好,我是 青松 !

🌈 希望用我的经验,让“程序猿”的AI学习之路走的更容易些,若我的经验能为你前行的道路增添一丝轻松,我将倍感荣幸!共勉~


【程序员 NLP 入门】词嵌入 - 上下文中的窗口大小是什么意思? (★小白必会版★)


词嵌入核心问题:

一、动因篇

  • 💯 什么是词向量化技术?
  • 💯 如何让向量具有语义信息?

二、基于统计的方法

  • 💯 如何基于计数的方法表示文本?
  • 💯 上下文中的窗口大小是什么意思?
  • 💯 如何统计语料的共现矩阵?
  • 💯 基于计数的表示方法存在哪些问题?

三、基于推理的方法

  • 💯 Word2Vec的两种模型分别是什么?
  • 💯 Word2Vec 中 CBOW 指什么?
  • 💯 Word2Vec 中 Skip-gram 指什么?
  • 💯 CBOW 和 Skip-gram 哪个模型的词嵌入更好?

四、问题优化篇

  • 💯 Word2Vec训练中存在什么问题?
  • 💯 Word2Vec如何优化从中间层到输出层的计算?
    • 用负采样优化中间层到输出层的计算
    • 负采样方法的关键思想
    • 负采样的采样方法
  • 💯 为什么说Word2vec的词向量是静态的?
  • 💯 Word2vec的词向量存在哪些问题?

💯 上下文中的窗口大小是什么意思?

上下文是指某个居中单词的周围词汇。这里,我们将上下文的大小(即周围的单词有多少个)称为窗口大小(window size)。窗口大小为1,上下文包含左右各1个单词;窗口大小为2,上下文包含左右各2个单词。


窗口大小为2的上下文例子。在关注goodbye时,将其左右各2个单词用作上下文

相关文章:

  • 电容加速电路!
  • 从零开始搭建Django博客②--Django的服务器内容搭建
  • 【2025最新面试Java八股】Java虚拟线程怎么回事,是协程吗?
  • 数智读书笔记系列030《曲折的职业道路:在终身工作时代找准定位》与《做自己的教练:战胜工作挑战掌控职业生涯》
  • 学习笔记:黑马程序员JavaWeb开发教程(2025.3.25)
  • Java高频面试之并发编程-05
  • LDO手册看点
  • 交易所开发:构建高效数字交易枢纽
  • C++与C
  • Redis在SpringBoot中的使用
  • Uniapp:swiper(滑块视图容器)
  • ubuntu20.04 远程桌面Xrdp方式
  • AR/VR衍射光波导性能提升遇阻?OAS光学软件有方法
  • AOSP Android14 Launcher3——RecentsView最近任务数据加载
  • Java面试实战:从Spring Boot到微服务的深入探讨
  • 双周报Vol.70: 运算符重载语义变化、String API 改动、IDE Markdown 格式支持优化...多项更新升级!
  • 用Java实现简易区块链:从零开始的探索
  • 智能电网第1期 | 工业交换机在变电站自动化系统中的作用
  • 【云馨AI-大模型】Dify 1.2.0:极速集成 SearXNG,畅享智能联网搜索新境界,一键脚本轻松部署SearXNG
  • 基于STM32、HAL库的MCP41010T数字电位器驱动程序设计
  • 土耳其发生6.2级地震,震源深度10千米
  • 神舟二十号航天员乘组计划于10月下旬返回
  • 2025年度“沪惠保”今日开售:保费维持129元/人,进一步扩增国内外特药种类
  • 商务部:试点示范已形成9批190多项创新成果向全国推广
  • 美国同日曝两起泄密事件:防长群聊向家人分享作战计划,白宫平面图被“共享”
  • 江西省人大教育科学文化卫生委员会主任委员王水平被查