Skip to content

问题及优化建议(windows) #5

@mzmqyh

Description

@mzmqyh

1、建议部署文档再详细一些,增加先在本地安装python运行环境这样的说明,要不然小白挺懵逼。我也是靠猜理解要先安装python运行环境
2、 建议windows 支持组合键,因为windows 的alt,fn ,win经常被其他程序占用
3、我的CONVERT TO SIMPLIFIED=true,输出录音完毕是简体,处理完毕成繁体了,应该处理的时候有问题吧,建议优化。
Image
4、感觉转录结果不是很准确,是因为对音频采样后,语音失真了吗?能换类似TTS这样的模型吗,育语音直接给模型,输出文字结果。
5、希望能按下按键后启动转录,再次按下停止。这样可以解放手。或者是在一定时间没有监测到语音输入,停止。
6、现在是松开按键后一次提交录音并转录,能否每积累一定长度的语音就提交,这样可以做到类似输入反馈的效果。
7、如果是多人对话的场景,能否按人区分输出内容。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions