All resources on this site are high-quality and available for download.
本项目是一个基于动态时间规整(DTW)算法的双语言语音识别系统,专门针对英语和波斯语的数字0-9发音以及基础控制指令进行识别。系统提供命令行和图形用户界面两种交互模式,支持实时音频流录制和离线音频文件识别两种输入方式,适用于教育演示、多语言人机交互等场景。
Start.m主脚本启动语音识别系统主程序文件实现了系统的核心控制逻辑,主要包括用户交互界面的初始化与调度、音频输入源的选择与参数配置、实时音频流的采集与处理控制、离线音频文件的加载与预处理、基于DTW算法的语音特征匹配计算、识别结果的综合评价与置信度分析、图形化显示数据的生成与管理,以及系统运行日志的记录与输出等功能。