当前位置: 首页 > news >正文

FastGPT原理分析-数据集创建第二步:处理任务的执行

概述

文章《FastGPT原理分析-数据集创建第一步》已经分析了数据集创建的第一步:文件上传和预处理的实现逻辑。本文介绍文件上传后,数据处理任务的具体实现逻辑。

数据集创建总体实现步骤

从上文可知数据集创建总体上来说分为两大步骤:

(1)文件上传和预处理,并验证各种配置和参数的合法性;

(2)触发数据处理任务,对数据进行向量化处理和QA问答对的处理。

本文介绍第二步的详细实现逻辑。

数据处理的触发的实现逻辑

在FastGPT中会在启动时注册一个监控mongodb的insert插入动作的函数。当有数据插入到mongodb对应的数据表dataset_trainings时,就会触发对应的数据处理的执行。

在这里插入图片描述

根据任务类型来调用对应的处理函数。

3.数据处理的触发

在系统初始化时,FastGPT注册了一个监听mongodb插入动作的处理函数代码如下:

export async function register() {
	// ...
	startMongoWatch(); // 监控mongodb的动作
	//...
}

// startMongoWatch函数的实现
export const startMongoWatch = async () => {
  reloadConfigWatch();
  refetchSystemPlugins();
  createDatasetTrainingMongoWatch();  //在这里注册mongodb的数据处理函数
};

// 创建mongodb的插入操作的监控任务处理
export const createDatasetTrainingMongoWatch = () => {
  const changeStream = MongoDatasetTraining.watch();

  changeStream.on('change', async (change) => {
    try {
      // 监控mongodb的插入操作
      if (change.operationType === 'insert') {
        const fullDocument = change.fullDocument as DatasetTrainingSchemaType;
        const { mode } = fullDocument;
        // 训练类型:QA问答对处理方式
        if (mode === TrainingModeEnum.qa) {
          generateQA();
        } else if (mode === TrainingModeEnum.chunk) {
        // chunk处理方式    
          generateVector();
        }
      }
    } catch (error) {}
  });
};

总结

本文介绍了文件上传后的任务触发方式。可以看到,是通过监控mongodb数据表dataset_trainings的插入操作来触发数据处理任务。有两种数据处理方式:(1)QA问答方式数据处理;(2)嵌入向量处理方式。后面会介绍这两种方式的具体实现逻辑。

相关文章:

  • 车载以太网网络测试-22【传输层-DOIP协议-5】
  • 【C语言系列】数据在内存中存储
  • 《青少年编程与数学》课程方案(第二版)
  • 【赵渝强老师】达梦数据库的数据库对象
  • [AI]自动化编写代码工具整理
  • 【多线程】初始线程和Thread类
  • 通过conda安装unsloth
  • 多线程—应用案例
  • Android一个APP里面最少有几个线程
  • 语法革新:AI 生成的 PanLang 语法体系深度解析——PanLang 原型全栈设计方案与实验性探索3
  • CH32V208GBU6沁恒协议栈BUG:在主机Write的同一包notify会造成主机一直Write不成功
  • 从汽车 BCM 方案看国产 MCU 芯片的突围与挑战
  • Netty源码—4.客户端接入流程二
  • 1167. 【宽度优先搜索BFS】数字交换游戏(保姆教程)(打破垄断)
  • ffmepg介绍(二)——解码
  • FlauBERT:面向法语的无监督语言模型预训练
  • 《人工智能赋能网络拓扑分析:洞察关键节点与脆弱链路》
  • 好吧好吧,看一下达梦的模式与用户的关系
  • 数据库数值函数详解
  • 二分查找------查找区间
  • 绵阳造AI机器狗参与警务工作,演练中辅助民警控制“嫌疑人员”
  • 加拿大驾车撞人事件遇难人数升到11人
  • 伊朗港口爆炸已致40人死亡
  • 原创话剧风向标!这个展演上《大宅门》《白鹿原》先后上演
  • 中国驻英国大使郑泽光:中国反制美国关税是为了维护国际公平正义和多边贸易体制
  • “雷公”起诉人贩子王浩文案开庭:庭审中不承认拐走川川