当前位置: 首页 > news >正文

Domain Adaptation领域自适应

背景与问题定义

传统监督学习假设:训练集与测试集数据分布一致。

Domain Shift:测试数据分布与训练数据不同,模型泛化性能骤降 。

例如在黑白图像上训练数字分类器,测试时用彩色图像,准确率骤降。

Domain Adaptation(领域自适应) 

目标:在Source Domain(有标签)上训练的模型能在Target Domain(无标签或少量标签)上保持良好性能。

基础思路:学习领域无关的表示

  • 引入Feature Extractor,提取源域与目标域的共享特征。

  • 要求:无论输入图片来源哪一域,提取的特征分布应尽可能一致。

 

这样就可以用这些 Feature, Source Domain 上训练一个模型 直接用在 Target Domain 上,
接下来的问题就是 , 怎麼找出这样一个 Feature Extractor

关键技术:Domain Adversarial Training

  • 模型结构:

    • Feature Extractor:提取特征。

    • Label Predictor:分类器。

    • Domain Classifier:判断特征来自 Source 还是 Target。

    • 希望 Source Domain 的图片 丢进  Feature Target Domain 的图片丢进去  Feature提取出的特征 看起来要分不出 差异
  • 类比于 GAN:

    • Feature Extractor 类似 Generator;

    • Domain Classifier 类似 Discriminator。

问题:会不会Feature Extractor每次故意提取出无效的特征导致训练失败?

并不会,因为虽然需要混淆 Source 和 Target 的域差异(欺骗 Domain Classifier),同时又要提取对分类有用的特征(服务于 Label Predictor)。

训练方法:

对于 Source Domain的图片,是有标签的。所以可以制定一个Loss L,Ld是 Domain Loss,即领域判别的损失

可以理解为 

  • 它想让分类器分类准(minimize L);

  • 同时又让 Domain Classifier 无法判断出域(maximize Ld)。

通过这里我们可以再回答一遍Feature Extractor会不会训练成故意提取出无效的特征?

如果Feature Extractor 把所有输入都映射为 zero vector,那么 Domain Classifier 完全无法判断这是 Source 还是 Target → Ld 很高 ✅(它被骗了);但是,Label Predictor 完全无法分类 → L 也会很高 ❌

相关文章:

  • Java多态课堂练习题
  • ​‌FireCrawl‌爬虫工具​, Craw4ai
  • 算法思想之模拟
  • LaTeX 的pstricks-add宏绘图练习
  • SJ7W5(四角号码7万五千字)取码细则V2
  • AWS Redshift的使用场景及一些常见问题
  • vue+flask+GNN+neo4j图书知识图谱推荐系统
  • 【SQL】COUNT... FILTER 的适用场景
  • 大模型在直肠癌诊疗全流程预测及应用研究报告
  • 已开源!CMU提出NavRL :基于强化学习的无人机自主导航和动态避障新方案
  • Threejs 奇幻几何体:边缘、线框、包围盒大冒险
  • 深入剖析 RocketMQ 中的 MappedFile 技术
  • 使用MCP服务通过自然语言操作数据库(vscode+cline版本)
  • [极客大挑战 2019]PHP 1
  • AI改变生活
  • 苍穹外卖day04
  • JPG同步删除RAW批处理文件
  • Vue ‘v-model‘ directives require the attribute value which is valid as LHS.
  • 八、自动化函数
  • 单基因高低分组和相关基因的GSEA等富集分析教程,代做分析
  • 孙燕姿演唱会本周末开唱,小票根如何在上海释放大活力
  • 上海开展2025年“人民城市 文明风采”群众性主题活动
  • 银行板块整体走强,工行、农行、中行股价再创新高
  • 民政部党组成员、中国老龄协会会长刘振国任民政部副部长
  • 韩国称DeepSeek未经同意将用户数据传至境外,外交部回应
  • 央媒关注脑瘫女骑手:7年跑出7.3万多份单,努力撑起生活