Skip to content

jxlpzqc/TMSpeech

Folders and files

NameName
Last commit message
Last commit date

Latest commit

fa97e8f · Nov 18, 2024
Nov 5, 2024
Jun 27, 2024
Mar 2, 2024
Jun 29, 2023
Nov 18, 2024
Jun 20, 2023
Mar 1, 2024
Jul 2, 2023
Mar 1, 2024
Jun 30, 2023
Dec 12, 2023
Nov 6, 2024
Nov 5, 2024

Repository files navigation

TMSpeech

视频演示:https://www.bilibili.com/video/BV1rX4y1p7Nx/

关键词:语音转文字,实时字幕,会议语音识别,歌词字幕展示,识别历史记录查看

TMSpeech 是一个Windows下的中文实时语音字幕,通过WASAPI的CaptureLoopback捕获电脑声音(录内音),将语音实时转文字,并以歌词字幕的形式展示。即使完全关闭电脑声音也能使用。

你可以:

  • 开会时更放心地走神,突然被喊到的时候不会那么不知所措,只需要看一看识别的历史记录。(本项目的名字来源于此)
  • 会议实时转录,自动生成会议纪要,并保存到文件。默认会将识别结果按日期保存到“我的文档”的TMSpeechLogs文件夹中

基于sherpa-onnx项目二次开发。实测在我的AMD 5800u的笔记本上CPU占用不到5%。

再次感谢sherpa-onnx项目的语音识别框架和模型。

展示

无边框窗口,可任意拖动和调整大小

正常识别窗口

鼠标悬浮时的窗口

使用

Release页面中下载最新的release解压,运行TMSpeech.GUI.exe即可。在桌面创建快捷方式,使用起来更加方便。

我们需要你的反馈

觉得很有用?但是还有不完美的地方?欢迎点击这里创建Discussion、提出反馈!

  • 识别准确率不高?
    • 这可能需要更好的模型。当前我们支持sherpa-onnx的流式模型,可以在这里下载其他模型,并在设置中修改模型路径。
    • 想要用自己的模型? 如果你发现了效果更好的开源模型,也欢迎推荐给我们!
  • 还需要更多功能?
    • 请点击这里创建issue告诉我们!
    • 如果你懂Windows/C#开发,欢迎提交pull request,开发的过程中遇到任何问题可以创建issue和我们讨论。

Release 流程

  • VisualStudio中右键项目,选择Publish,增加publish到文件夹的配置。
  • 点击Show all settings修改Publish配置,
    • Configuration为Release,
    • 选择Deployment modeself-contained
    • 设置target runtimewin-x64
  • 将模型文件夹复制到publish的文件夹内,重命名为models,打包为zip文件。
  • 在开发电脑,和另外一台电脑上测试各种功能。