当前位置: 首页 > news >正文

知识体系_数据量纲化处理方式

在进行数据分析时,变量具有单位是很常见的,比如页面加载耗时,可以以毫秒作为单位,也可以以秒作为单位,此时会出现量纲问题而导致数值不能直接比较大小,例如1000毫秒=1秒,不能因为1000>1 ,而认为1000毫秒>1秒。

数据量纲化处理后的数据也要保持数据的相对大小关系,例如页面加载耗时(毫秒),假如有两个值A和B,A>B,量纲化处理后分别为A_1和B_1,应该要满足A_1>B_1

量纲化有很多种处理方式,具体应该使用哪一种方式,并没有固定的标准,量纲化按是否具有实际意义可分为两类,⼀类是量纲处理⽅式有着⼀定的实际意义,另⼀类是仅数理⻆度的量纲处理方式:

有意义的量纲化处理:⽐如均值化,初值化,最⼩值化,最⼤值化,和求和归⼀化,平⽅和归⼀化共6种。分别代表数据除以平均值,数据除以第1个数,数据除以最⼩值,数据除以最⼤值,数据除以求和值,数据除以平⽅和值。相当于说,它们都找到⼀个参照标准项,然后所有数据去除以参照标准项。此6种⽅式的特点在于,⼀般要求数据全部都⼤于0,如果出现⼩于0或者等于0就有可能出问题,⽐如刚好分⺟为0,那么就出现⽆法相除。

仅数理化的量纲化处理:包括标准化,中⼼化,归⼀化,正向化,逆向化,区间化,均在于让数据保持在⼀定的区间范围内,⽽且处理后带有⼀定的数理特征,⽐如标准化后数<

相关文章:

  • 详细图解 Path-SAM2: Transfer SAM2 for digital pathology semantic segmentation
  • 计算机网络-运输层(1)
  • 2025.4.27_C_Struct,Enum,Union
  • 如何通过OKR管理项目目标
  • 【第三十三周】BLIP论文阅读笔记
  • Flink02-学习-套接字分词
  • Ldap高效数据同步- MirrorMode双主复制模式配置详解(上)
  • 在 Cursor 中 配置 GitHub MCP Server
  • AI 应用同质化:一场看不见的资源 “吞噬战”
  • 软考:软件设计师考试数据结构知识点详解
  • HTML5 新特性详解:语义化标签、表单与音视频嵌入
  • 底层源码和具体测试解析HotSpot JVM的notify唤醒有序性(5000字详解)
  • JimuBI 积木报表 v1.9.5发布,大屏和仪表盘,免费数据可视化
  • 当AI浏览器和AI搜索替代掉传统搜索份额时,老牌的搜索引擎市场何去何从。
  • ubuntu 日志文件清空方式的解读
  • Ubuntu22.04/24.04 P104-100 安装驱动和 CUDA Toolkit
  • FFmpeg之三 录制音频并保存, API编解码从理论到实战
  • C++初阶-STL简介
  • Unity 和 Unreal Engine(UE) 两大主流游戏引擎的核心使用方法
  • 司法大模型构建指南
  • 专业竞演、剧场LIVE直播,32位越剧新星逐梦上海
  • 准85后青海海北州副州长、州公安局局长李贤荣赴山东临沂挂职
  • “五一”假期全国口岸日均出入境人员将达215万人次
  • 利物浦提前四轮英超夺冠,顶级联赛冠军数追平曼联
  • 野猪穿过江苏电视台楼前广场,被抓捕后送往红山森林动物园
  • 在上海生活8年,13岁英国女孩把城市记忆写进歌里