当前位置: 首页 > news >正文

.net core 项目快速接入Coze智能体-开箱即用-第2节

目录

一、Coze智能体的核心价值

二、开箱即用-效果如下

三 流程与交互设计

本节内容调用自有或第三方的服务 实现语音转文字

四:代码实现----自行实现 STT 【语音转文字】

五:代码实现--调用字节API实现语音转文字


.net core 项目快速接入Coze智能体-开箱即用

.net core快速实现AI智能聊天功能

.net core快速实现AI智能聊天功能-语音转文字

一、Coze智能体的核心价值


字节跳动推出的新一代AI开发平台,Coze支持开发者快速构建智能体并发布为API服务。其核心优势包括:

多模态能力:支持文本、图像、视频等数据处理
零代码插件集成:内置必应搜索、头条新闻等插件,增强智能体功能
[理解为字节跳动版的GPT]

二、开箱即用-效果如下

三 流程与交互设计

下面关健内容是单独写文章说明。没写要想了解的可留言


1用户+内容---提交
2是否新用户
3创建会话/使用之前会话
4分析意图/内部/外部-----可选(特定业务处理)
5内部意图约定与回复--前端处理-----可选
6发起对话-----调用大模型/智能体
7等对话结果
8回复话内容
---记录交互日志(用于跟踪与分析 是否合理)
--优化意图
--优化智能体/完善智能体

9TTS 文字转语音---.net windows下的实现

10 STT 语音转文字  ---.net windows下的实现

本节内容调用自有或第三方的服务 实现语音转文字

/// <summary>
/// 语音转文字
/// </summary>
/// <param name="type">0自有  1扣子(收费)</param>
/// <param name="file"></param>
/// <returns></returns>
[HttpPost]
[AllowAnonymous]
public async Task<ResultMo<List<string>>> STTPostFile2(int type, IFormFile file)
{// 直接获取 IFormFile 的流using (Stream stream = file.OpenReadStream()){// 这里可以使用流进行操作,例如读取内容byte[] buffer = new byte[stream.Length];await stream.ReadAsync(buffer, 0, buffer.Length);if (type == 1){stream.Position = 0;return await CozeApi.SttCozeByS(stream);}else{stream.Position = 0;return await STTHC(stream);}}
}

四:代码实现----自行实现 STT 【语音转文字】

Whisper.net 是一个用于 .NET 平台的 OpenAI Whisper 语音识别库的封装,它可以让你在 .NET 应用程序中使用 Whisper 模型进行语音识别。
1. 安装依赖
你可以通过 NuGet 包管理器来安装 Whisper.net。在 Visual Studio 的包管理器控制台中运行以下命令:
plaintext
Install-Package Whisper.net
2. 代码
 


csharp
using System;
using System.IO;
using Whisper.net;
using Whisper.net.Ggml;class Program
{static async System.Threading.Tasks.Task Main(){// 下载并选择合适的 Whisper 模型,这里使用 tiny 模型var modelPath = "ggml-tiny.bin";// 检查模型文件是否存在if (!File.Exists(modelPath)){await DownloadModel(GgmlType.Tiny);}// 创建 Whisper 处理器using var factory = WhisperFactory.FromPath(modelPath);using var processor = factory.CreateBuilder().WithLanguage("en") // 设置语言为英语.Build();// 加载音频文件var audioData = File.ReadAllBytes("audio.wav");// 处理音频并获取转录结果await foreach (var result in processor.ProcessAsync(audioData)){Console.WriteLine($"开始时间: {result.Start},结束时间: {result.End},文本: {result.Text}");}}static async System.Threading.Tasks.Task DownloadModel(GgmlType modelType){using var modelStream = await WhisperGgmlDownloader.GetGgmlModelAsync(modelType);using var fileWriter = File.OpenWrite("ggml-tiny.bin");await modelStream.CopyToAsync(fileWriter);}
}

        ggml-tiny.bin下载地址

https://download.csdn.net/download/qq_33906319/90638847https://download.csdn.net/download/qq_33906319/90638847

五:代码实现--调用字节API实现语音转文字

 /// <summary>/// STT 语音转文字/// </summary>/// <param name="fileStream"></param>/// <returns></returns>public static async Task<ResultMo<List<string>>> SttCozeByS(Stream fileStream){var bearerToken = await CozeApi.AccessToken();string apiUrl = CozeDto.Ulr + "v1/audio/transcriptions";try{using var client = new HttpClient();// 配置客户端参数client.Timeout = Timeout.InfiniteTimeSpan;client.DefaultRequestHeaders.Authorization =new AuthenticationHeaderValue("Bearer", bearerToken);// 准备文件内容//await using var fileStream = System.IO.File.OpenRead(filePath);using var content = new MultipartFormDataContent();using var fileContent = new StreamContent(fileStream);// 设置文件内容类型fileContent.Headers.ContentType = new MediaTypeHeaderValue("audio/wav");content.Add(fileContent, "file", Path.GetFileName("1.wav"));// 发送请求var response = await client.PostAsync(apiUrl, content);response.EnsureSuccessStatusCode();// 读取响应var responseBody = await response.Content.ReadAsStringAsync();// 解析 JSON 字符串JObject jsonObject = JObject.Parse(responseBody);string code = jsonObject["code"]?.Value<string>();string msg = jsonObject["msg"]?.Value<string>();JToken dataToken = jsonObject["data"];string text = null;if (dataToken != null){text = dataToken["text"]?.Value<string>();}if (code == "0")return new ResultMo<List<string>>(new List<string> { text });else return new ResultMo<List<string>>(msg);}catch (Exception ex){Console.WriteLine($"Error: {ex.Message}");return new ResultMo<List<string>>(ex.Message);}}

相关文章:

  • langgraph框架之初识
  • AI 编程工具—如何在 Cursor 中集成使用 MCP工具
  • Banana Pi BPI-RV2 RISC-V 路由器开发板发售, 全球首款RISC-V路由器
  • STM32单片机入门学习——第41节: [12-1] Unix时间戳
  • SpringAI入门:对话机器人
  • docker 镜像
  • MySQL中高级语法
  • 解决 Spring Boot 多数据源环境下事务管理器冲突问题(非Neo4j请求标记了 @Transactional 尝试启动Neo4j的事务管理器)
  • polkitd服务无法启动导致docker无法启动问题解决
  • 海关总署广东:广东外贸一季度进出口2.14万亿元 同期增长4.2%
  • 2.2/Q2,Charls最新文章解读
  • 【Python爬虫基础篇】--2.模块解析
  • 07_Docker 资源限制
  • Jenkins的使用及Pipeline语法讲解
  • Android Studio 常见报错
  • 从零开始学Python游戏编程31-类3
  • 深入简出:KL散度、交叉熵、熵、信息量简介、交叉熵损失
  • ubuntu学习day3
  • QT 文件和文件夹操作
  • 校平机:精密制造的“材料雕刻家“
  • 租到“甲醛房”,租客可以解约吗?租金能要回来吗?
  • 日本多地发生无差别杀人事件,中使馆提醒中国公民加强安全防范
  • 碳市场扩围推动汽车行业降碳,用真实碳数据量化成本是关键
  • 美空军B-1B轰炸机抵达日本,执行战略威慑任务
  • 人事时间|商务部国际贸易谈判代表是什么职务,负责哪些工作?
  • “95后”企业家为浙江全省干部上课,讲授AI数据