字幕大师是一款高准确率语音识别的字幕制作软件。目前市面上大部分视频字幕工作者仍依赖于人工手动编辑,使用起来麻烦又费时间,OKVoice创新的运用了自主研发的语音识别技术,将视频中的声音自动识别为文字,自动将音频文字等匹配为时间轴,生成字幕文件,在整个制作过程中大大减少了人工干预,对齐准确率也超过了93%,提高了工作效率的同时还减少了人工。该软件颠覆了普通字幕软件的基本操作流程,在OKVoice字幕软件的自动对齐功能中只需要导入音频和文本就能自动生成时间轴,改变了以往手拍字幕的繁琐。软件具有支持断点续传、支持批量上传、支持自动对齐等三个特点。字幕大师拥有全新界面简洁清晰,给用户更好的使用体验感。多任务管理功能进行了优化,支持批量操作或者单独操作。有需要的用户们快来下载体验吧!
是将文本状态的文字信息转换为可闻其声的语音信息处理技术。
字幕大师涉及语音学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。
随着语音合成技术不断的发展与成熟,文字信息不仅限于眼睛的阅读,而是耳朵对文字的聆听,让生活更加的方便快捷。
2、语音识别
将人类的自然语言转化为计算机可以理解的数据语言,这种转化是达成语音识别的基础。
语音识别的应用范围广泛,如:语言拨号、语音导航、语音智能家居、语音检索、听写录入等。
随着语音识别技术的发展和完善,不同语言语音机器翻译就会出现,人类将迎来无语言沟通障碍的世界。
3、声纹识别
是根据语音波形反映说话人声音和行为特征的语音参数,能自动识别说话人身份的技术。
与语音识别不同的是,声纹识别是采取语音信号中说话人的身份信息,并不考虑语音中的字词意思。
由于每个人的生物特征具有与其他人不同的唯一性,不易伪造和假冒,所以利用声纹识别技术进行身份认证,更加安全可靠。
4、低速率编码
先进的编码技术,最低通讯编码可以在600bps以下。
高质量的语音通讯质量,600bps以下速率的PESQ分可达2.6。
稳定的通讯效率,可在各种极端环境下保证信道传输稳定。
5、智能对话
精准智能的对话理解,支持多种应用场景对话内容理解。
面向垂直领域的语义解析准确率高达95%以上。
自有的数千G规模互联网语料,确保各种词汇的理解。
2、该软件对背景音乐、视频内的环境音、说话人口音有要求,背景音越干净、口音越准确,识别准确率越高
3、一般一小时内的音视频文件处理起来没问题
4、不能识别歌曲、唱词
A字幕大师暂时没有翻译功能哦,处理过程中均需要音频和文本语种保持一致。
2、怎么操作?
A各项功能都有详细的操作说明,可以查看操作说明,如果它没有完美解答你的疑问,也可以联系客服哦~
3、输出文件是什么?
A目前输出的是SRT、VTT、ASS三种格式的外挂字幕文件。
4、能不能把视频和外挂字幕压制在一起?
A字幕大师目前只输出单独的外挂字幕文件,没有压制功能哦~
5、外挂字幕怎么用?
A只需要在播放音视频文件的同时,将外挂字幕拖进播放器即可。或者将音视频文件和外挂字幕命名为同一个文件名,放在同一文件夹下,即可在播放时自动加载。
6、生成的外挂字幕文件能不能导入PR,Edius等视频剪辑工具中?
A需要视该视频剪辑软件是否支持。目前仅有会声会影支持SRT外挂字幕的导入编辑。
2、新增工程项目,支持打开工程二次修改
3、可根据语音识别生成字幕
4、优化降噪算法
5、支持导入srt文件进行修改
6、支持字幕批量前置、批量后置
7、字幕修改支持上下行合并、删除行、切分、标记
8、优化时间轴操作
9、多任务管理功能优化,支持批量操作、单独操作
软件功能
1、语音合成是将文本状态的文字信息转换为可闻其声的语音信息处理技术。
字幕大师涉及语音学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。
随着语音合成技术不断的发展与成熟,文字信息不仅限于眼睛的阅读,而是耳朵对文字的聆听,让生活更加的方便快捷。
2、语音识别
将人类的自然语言转化为计算机可以理解的数据语言,这种转化是达成语音识别的基础。
语音识别的应用范围广泛,如:语言拨号、语音导航、语音智能家居、语音检索、听写录入等。
随着语音识别技术的发展和完善,不同语言语音机器翻译就会出现,人类将迎来无语言沟通障碍的世界。
3、声纹识别
是根据语音波形反映说话人声音和行为特征的语音参数,能自动识别说话人身份的技术。
与语音识别不同的是,声纹识别是采取语音信号中说话人的身份信息,并不考虑语音中的字词意思。
由于每个人的生物特征具有与其他人不同的唯一性,不易伪造和假冒,所以利用声纹识别技术进行身份认证,更加安全可靠。
4、低速率编码
先进的编码技术,最低通讯编码可以在600bps以下。
高质量的语音通讯质量,600bps以下速率的PESQ分可达2.6。
稳定的通讯效率,可在各种极端环境下保证信道传输稳定。
5、智能对话
精准智能的对话理解,支持多种应用场景对话内容理解。
面向垂直领域的语义解析准确率高达95%以上。
自有的数千G规模互联网语料,确保各种词汇的理解。
注意事项
1、使用该软件需在联网的环境下2、该软件对背景音乐、视频内的环境音、说话人口音有要求,背景音越干净、口音越准确,识别准确率越高
3、一般一小时内的音视频文件处理起来没问题
4、不能识别歌曲、唱词
常见问题
1、能不能把字幕翻译成别的语言?A字幕大师暂时没有翻译功能哦,处理过程中均需要音频和文本语种保持一致。
2、怎么操作?
A各项功能都有详细的操作说明,可以查看操作说明,如果它没有完美解答你的疑问,也可以联系客服哦~
3、输出文件是什么?
A目前输出的是SRT、VTT、ASS三种格式的外挂字幕文件。
4、能不能把视频和外挂字幕压制在一起?
A字幕大师目前只输出单独的外挂字幕文件,没有压制功能哦~
5、外挂字幕怎么用?
A只需要在播放音视频文件的同时,将外挂字幕拖进播放器即可。或者将音视频文件和外挂字幕命名为同一个文件名,放在同一文件夹下,即可在播放时自动加载。
6、生成的外挂字幕文件能不能导入PR,Edius等视频剪辑工具中?
A需要视该视频剪辑软件是否支持。目前仅有会声会影支持SRT外挂字幕的导入编辑。
更新日志
1、全新界面,底层优化2、新增工程项目,支持打开工程二次修改
3、可根据语音识别生成字幕
4、优化降噪算法
5、支持导入srt文件进行修改
6、支持字幕批量前置、批量后置
7、字幕修改支持上下行合并、删除行、切分、标记
8、优化时间轴操作
9、多任务管理功能优化,支持批量操作、单独操作
∨ 展开