相关文章
TensorFlow实现语音识别
整体介绍:
环境python3.6+TensorFlow1.12 显卡是英伟达GTX1070(后头换个好些的显卡)训练了四天四夜
主要技术点CTC,BRNN,MFCC特征,全连接神经网络
CTC时序分类算法: 适合这种不知道输入输出是否对齐的情况(哪个字对应哪段声音)使用的算法,所以CTC适合语音识别和手写字…
建站知识
2024/11/14 8:11:41
深度学习100例 | 第41天:语音识别 - PyTorch实现
文章目录 一、导入数据1. 下载数据2. 数据展示二、数据准备工作1. 格式化数据2. 标签的编码与还原3. 构建数据加载器三、构建模型四、训练模型1. 训练过程中的loss五、测试模型🍖 我的环境: 语言环境:Python3.8编译器:Jupyter Lab深度学习环境: torch==1.10.0+cu113torch…
建站知识
2024/11/24 16:24:44
音乐音频 | 语音识别与音乐流派分类
文章目录 语音识别步骤一、用SVM做音乐分类应用实例1、数据集:EchoNest。2、代码:①数据归一化。沿着最大方差轴旋转数据,确定数据的每个特征 对 类之间方差的相对贡献。特征的均值0,标准差1。②主成分分析(PCA&#x…
建站知识
2024/11/14 9:41:05
语音识别之Kaldi:学习GMM-HMM
语音识别之Kaldi
kaldi语音识别理论与实践课程学习。
前面的博客介绍了语音识别的基础知识及原理。现在开始学习实战。以Kaldi框架为基础。
Kaldi是一个有全套的语音识别代码的工具,由Dan Povey博士和捷克的BUT大学联合开发,最早发布于2011年…
建站知识
2024/11/14 9:41:04
微信小程序-开放标签
本篇背景
最近做了一个h5的需求,不知道大家会不会这样,一直写小程序说实话提手有点忘了该怎么敲html。。。通过这个需求,还学到了很多东西:开放标签,JS-SDK等等,此篇作为沉淀下子的文章。PS:虽…
建站知识
2024/11/14 9:41:04
TTS | 基于FastSpeech2的语音中英文语音合成项目
本文主要实现了基于fastspeech2模型的语音合成项目,并训练自己的语音模型~~
环境:Ubuntu(docker),pytorch,
项目地址1(中英文)
GitHub - ming024/FastSpeech2: An implementation of Microsofts "FastSpeech 2: Fast and High-Quality End-to-En…
建站知识
2024/11/14 9:41:04