wenet - 程序员宅基地

wenet实战系列-双声道音频语音识别

标签：语音识别人工智能自然语言处理

双声道音频语音识别demo，ASR模型使用wenet，VAD模型使用WebRTC VAD，可用于客服电话场景等

wenet动态chunk的设计逻辑

标签： wenet 语音识别

本文主要介绍wenet的动态chunk设计技巧

WeNet 更新：支持热词增强

标签： xcode macos ide

对于这些专有词汇，通过在 WeNet 中使用热词增强方案，添加热词可以显著提升识别的准确率。近期，WeNet 的更新支持了两种解码器上热词增强，包括 CTC Prefix Beam Search 和 WFST Beam Search。

WeNet 热词增强 2.0 强势来袭

标签：人工智能

继《WeNet 更新：支持热词增强》两年后，WeNet 近期更新了热词增强 2.0。本次更新内容是使用 AC 自动机 (Aho-Corasick automaton) 对热词进行构图，解决热词之间存在的重叠问题[1]。早在 2022 年 5 月份，@victor...

《WeNet语音识别实战》答疑回顾（二）

标签：语音识别人工智能

WeNet的核心目标是为语音识别提供一套高性能易部署的工业级解决方案，完全聚焦于语音识别任务，同时对于常用的语音识别应用场景提出了一套效果极佳的端到端解决方案，而不去提供各类模型方案的大而全的集合。...

Windows下编译语音识别引擎Wenet

标签： wenet 语音识别 openfst

Windows下编译语音识别引擎Wenet一、Wenet简介二、Wenet首次编译过程2.1下载第三方库源码2.2替换软链接2.3下载gRPC的third_party三、Wenet第二次编译过程3.1Git中设置代理3.2Cmake中设置代理3.3进行编译参考文档 ...

完美解释：wenet-流式与非流式语音识别统一模型

标签：语音识别深度学习人工智能

Unified Streaming and Non-streaming Two-pass End-to-end Model for Speech Recognition 流式与非流式语音识别统一模型-出门问问&西工大方案 1.模型结构如下图所示，模型包含三个部分，分别为共享的Encoder、...

西工大 ASLP 实验室在 WeNet 中开源基于 CPPN 的神经网络热词增强语音识别方案

标签：神经网络语音识别人工智能

因此，我们最初的动机就是寻找 AED 模型上有效的神经网络热词增强方案，并且由于我们使用 WeNet 框架进行实验，基于 attention rescore 解码依靠 CTC 后验的特点，我们希望能够在 Encoder 部分就能进行神经网络热词...

知识蒸馏（尝试在ASR方向下WeNet中实现）

标签：人工智能语音识别

知识蒸馏 ASR WeNet logits

带你认识WeNet语音识别系统

标签：语音识别

WeNet语音识别系统作为哈稀科技旗下的重要产品，凭借其创新的深度学习和人工智能技术，以及高准确率和稳定性，取得了显著的成果。预计未来的WeNet将会继续提高准确率、降低识别延迟，适应更多的应用场景，并实现更加...

WeNet2.0：提高端到端ASR的生产力

标签：语音识别 wenet

全新的 WeNet 2.0 在各种语料库上比原来的 WeNet 实现了高达 10% 的相对识别性能提升，并提供了几个面向生产的重要特性。

wenet在arm开发板rk3588编译踩坑记录

标签： python 深度学习开发语言

wenet用的是libtorch1.10.0，这里需要下载pytorch1.10.0进行编译。在加载模型 torch::jit:load(model_path,device) 前，增加如下代码，注意这里下载最新的模型，老版本比如wenet-1.0.1版本下的模型会出现类似下面的...

编译wenet的踩坑记录

标签：人工智能

编译Wenet

调用WeNet与百度智能云API进行语音识别

标签：百度语音识别人工智能

调用WeNet与百度智能云进行语音识别，并且使用自定义训练集进行训练。调用wenet的解码器，对测试语音进行识别，输出中文语句；调用百度智能云的api进行语音识别；尝试构建或下载自定义语音数据集，使用wenet框架进行...

WeNet语音识别调用通义千问

标签：语音识别人工智能通义千问

WeNet语音识别对通义千问（Qwen-72B-Chat Bot）调用，首先通过WeNet将用户的语音输入转录为文本，然后将此文本输入通用问答模型以获取答案。整个代码的目的是提供一个基于Gradio的界面，使用户能够通过语音与Qwen-72...

wenet/utils/mask.py代码理解

标签：深度学习 python Wenet

本文主要是对wennet中wenet/utils/mask.py代码注解

语音识别开源模型 -- wenet

标签：语音识别

于是我尝试了下面的 wenet。文档：https://github.com/wenet-e2e/wenet初步试了试网页版，不太准呀。在windows 的 wsl 内：然后，在windows 命令行内：然后，用浏览器打开：wenet\runtime\LibTorch\web\...

基于Wenet长音频分割降噪识别

标签：音视频

Wenet是一个流行的语音处理工具，它专注于长音频的处理，具备分割、降噪和识别功能。它的长音频分割降噪识别功能允许对长时间录制的音频进行分段处理，首先对音频进行分割，将其分解成更小的段落或语音片段。最后，...

WeNet语音识别分词制作词云图

标签：语音识别人工智能

本篇博客将介绍如何使用 Streamlit、jieba、wenet 和其他 Python 库，结合语音识别（WeNet）和词云生成，构建一个功能丰富的应用程序。我们将深入了解代码示例中的不同部分，并解释其如何实现音频处理、语音识别和...

wenet实战系列-gpu环境配置

本文介绍libtorch下gpu环境的配置

语音识别（ASR)论文优选：WeNet

标签：语音识别人工智能深度学习

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。...如转载，请标明出处。...WeNet: Production Oriented Streaming and Non-streaming End-to-End Speech Recognition Tool..

wenet语音识别---demo快速开发教程/windows下识别（大白/零基础）

标签：语音识别

https://github.com/wenet-e2e/wenet/blob/main/README_CN.md 把这个下到本地把这个下到本地先，上面的先不用管二、有服务器的朋友看这里（没有的跳过，看三）有服务器的朋友，先在自己的服务器装好docker，没有...

语音之家SOTA｜Leaderboard 新增 WenetSpeech 数据集预训练 WeNet 模型

标签：人工智能深度学习

从数字可以看出，基于 WenetSpeech 数据集的 WeNet 模型在性能上已经超过了百度的付费商业引擎，逼近行业头部商业引擎的 [从数据到框架的全栈开源系统，在性能上开始超越商业付费系统的案例，在很多技术领域的发展...

目前WeNet的时间戳方案不太准确（一是静音的判断不准确，二是字与字的时间戳是连着的，无论中间静音有多大...

标签：人工智能自然语言处理语音识别

目前WeNet的时间戳方案不太准确（一是静音的判断不准确，二是字与字的时间戳是连着的，无论中间静音有多大），请问有什么方案可以提高时间戳的准确度吗？

解析WeNet云端推理部署代码

摘要：WeNet是一款开源端到端ASR工具包，它与ESPnet等开源语音项目相比，最大的优势在于提供了从训练到部署的一整套工具链，使ASR服务的工业落地更加简单。

deepspeed_wenet debug记录

标签： python

下一个报错是/home/environment/hnzhang/Anaconda3/envs/d_spd/lib/python3.9/site-packages/deepspeed/launcher/runner.py", line 407, in main，接下来查看对应文件。根据warning和error，首先观察文件/home/...

使用onnx模型的wenet decoder

标签： python 深度学习语音识别

wenet online onnx decoder 仓库地址与文章魔改WeNet导出Onnx关联准备onnx模型本系统使用wenet-onnx导出的onnx模型 encoder_chunk.onnx decoder.onnx ctc.onnnx 环境配置 torch、CUDA版本以及其他python包安装...

wenet 频谱增强的原理和代码实现

标签：深度学习人工智能 kaldi

原理：该方法实在u2++中作为第二个创新点提出的，其作用是...代码位置：https://github.com/wenet-e2e/wenet/blob/main/wenet/dataset/dataset_deprecated.py 代码分析： ———————————— _spec_aug_me.

wenet编译报Do not know how to define a 32-bit integer quantity on your system

标签： centos linux 运维

wenet编译报错

wenet如何在训练后接着训练以及直接对预训练模型进行再次训练（如在新的数据集上再训练）？

标签：深度学习人工智能机器学习

Wenet如何对模型接着训练？

”wenet“ 的搜索结果

wenet实战系列-双声道音频语音识别

wenet动态chunk的设计逻辑

WeNet 更新：支持热词增强

WeNet 热词增强 2.0 强势来袭

《WeNet语音识别实战》答疑回顾（二）

Windows下编译语音识别引擎Wenet

完美解释：wenet-流式与非流式语音识别统一模型

西工大 ASLP 实验室在 WeNet 中开源基于 CPPN 的神经网络热词增强语音识别方案

知识蒸馏（尝试在ASR方向下WeNet中实现）

带你认识WeNet语音识别系统

WeNet2.0：提高端到端ASR的生产力

wenet在arm开发板rk3588编译踩坑记录

编译wenet的踩坑记录

调用WeNet与百度智能云API进行语音识别

WeNet语音识别调用通义千问

wenet/utils/mask.py代码理解

语音识别开源模型 -- wenet

基于Wenet长音频分割降噪识别

WeNet语音识别分词制作词云图

wenet实战系列-gpu环境配置

语音识别（ASR)论文优选：WeNet

wenet语音识别---demo快速开发教程/windows下识别（大白/零基础）

语音之家SOTA｜Leaderboard 新增 WenetSpeech 数据集预训练 WeNet 模型

目前WeNet的时间戳方案不太准确（一是静音的判断不准确，二是字与字的时间戳是连着的，无论中间静音有多大...

解析WeNet云端推理部署代码

deepspeed_wenet debug记录

使用onnx模型的wenet decoder

wenet 频谱增强的原理和代码实现

wenet编译报Do not know how to define a 32-bit integer quantity on your system

wenet如何在训练后接着训练以及直接对预训练模型进行再次训练（如在新的数据集上再训练）？

推荐文章