当前位置: 首页 > news >正文

语音识别质量的跟踪

背景

这个项目是用来生成结构化的电子病历的。数据的来源是医生的录音。中间有一大堆的处理,语音识别,关键字匹配,结构化处理,病历编辑......。最多的时候给上百家医院服务。

语音识别质量的跟踪

一、0225医院的训练后的情况分析:

通过0225医院的20278、46248、47146、47160、27823、47830、47879、48824、48837、48848医生的统计,发现这批医生在训练之后识别的质量有提升。具体如下:

通过曲线可以看出,在人工训练之后(图中的竖线右边的部分),Score有所提高,平均提高50分左右。

通过曲线可以看出,在训练之后(图中的竖线右边的部分),识别引擎在识别过程中耗费的时间大大降低了。识别时间的降低,可以减少报告的识别超时从而降低BlankCDA的报告数,同时也能减轻识别服务器的压力。所以,识别时间的降低对整个系统有着积极的意义。

二、其他医院的训练分析:

其他医院训练的时间比较早,当时的日志记录中还没有SR_Score的记录。需要等下次训练后,才可以进行识别质量分析。

三、当前识别质量统计:

       就目前的统计数据来看,在800分(满分为1000分)以下或识别时长超过4倍的医生还有一些,但是比例不是很大。具体如下:

      

      

       就统计结果来看,Score低于800的大约占1.27%

      

就统计结果来看,识别时间大于4的大约占5.07%

四、识别分数低于800或识别时长超过4的医生的列表:

    共计46人,详见下表。

HOSP_CODE

DOCTOR

AVG_SR_SCORE

PROCESSTIME/DICTLEN

0011

561

813

5.13

0013

0402

828

4.80

0013

2213

819

4.04

0013

3032

861

4.05

0013

3170

805

5.66

0013

3268

795

4.37

0014

0004

742

6.41

0014

0824

751

5.56

0014

4401

816

4.85

0014

77807

831

4.30

0014

9596

860

4.64

0015

80000

835

4.33

0015

98400

821

5.14

0016

1512

784

5.56

0016

1710

805

4.91

0016

2087

831

4.68

0016

2156

855

4.18

0016

2176

697

3.17

0016

2462

860

4.03

0016

3274

787

4.27

0016

3323

852

4.14

0016

4367

860

4.02

0016

559

857

4.02

0066

0430

813

4.96

0066

2259

828

4.21

0066

2485

771

5.46

0066

2742

807

4.91

0066

2832

807

5.50

0066

3031

820

4.37

0066

3131

832

4.54

0066

4196

571

5.35

0066

5222

849

4.45

0066

5853

782

4.74

0066

6910

875

4.54

0088

366

827

4.23

0223

17355

858

4.09

0223

42648

807

4.86

0223

7790

815

5.16

0225

14383

809

4.17

0225

40922

836

4.44

0225

42145

812

4.46

0225

43724

621

3.37

0225

45217

816

4.32

0225

46268

793

4.74

0225

47823

827

4.29

0225

48848

865

4.22

对于特定医生的语音识别质量跟踪

5853医生的识别质量变化曲线:

6910医生的识别质量变化曲线:

5018医生的识别质量变化曲线:

1375医生的识别质量变化曲线:


 

相关文章:

  • 【Unity完整游戏开发案例】从0做一个太空大战游戏
  • 火语言RPA--企业微信群通知
  • 剑指Offer(数据结构与算法面试题精讲)C++版——day21
  • OpenGl ES 3.0 笔记一:初步概念
  • Node.js CSRF 保护指南:示例及启用方法
  • Macos m系列芯片环境下python3安装mysqlclient系列问题
  • Java 深度与实战 · 每日一读 :高频面试真题解析 · ReentrantLock / CAS / AQS 篇
  • JVM常见的垃圾回收器
  • PyDantic入门介绍:Python数据验证与解析的利器
  • WPF之XAML基础
  • Java + Spring Boot + MyBatis获取以及持久化sql语句的方法
  • Redux 容器 | 原理解析
  • shell编程基础知识及脚本示例
  • 设计模式每日硬核训练 Day 16:责任链模式(Chain of Responsibility Pattern)完整讲解与实战应用
  • 分析型数据库入门指南:如何选择适合你的实时分析工具?
  • 哈希表基础
  • Ollama 在本地分析文件夹中的文件
  • 本安型交换机 + TSN:煤矿智能化的关键拼图
  • AI大模型从0到1记录学习 linux day21
  • 【论文阅读】-周总结-第5周
  • 人社部:我国劳动力市场潜力足,韧性强
  • 我的科学观|张峥:AI快速迭代,我们更需学会如何与科技共处
  • 杭州打造商业航天全产业链,请看《浪尖周报》第22期
  • 哈马斯同意释放剩余所有以方被扣押人员,以换取停火五年
  • 京东美团开打,苦了商家?
  • 巴黎奥运后红土首秀落败,郑钦文止步马德里站次轮