我们做了个软件,免费给视频自动加字幕、音频转文稿

您所在的位置:网站首页 字幕软件工具有哪些 我们做了个软件,免费给视频自动加字幕、音频转文稿

我们做了个软件,免费给视频自动加字幕、音频转文稿

2024-07-11 04:28| 来源: 网络整理| 查看: 265

今天要给大家介绍的软件是:33字幕。

软件下载:https://www.33subs.com/

这篇文章除了给大家介绍软件的功能特点,还会告诉大家如何在33字幕内集成本地模型,来实现免费给视频加字幕或生成文稿的能力。

语音转文本和制作字幕的软件这么多,为什么选择33字幕?

理由1:不花钱就能用

由于语音识别需要消耗巨大的算力,所以很多语音转写或字幕软件,都是通过按音频时长来进行收费,收费便宜点的,也要在10元左右一小时。

而33字幕由于支持使用本机算力进行识别,因此可以免费提供给大家使用,当然我们也提供了体验更好的云端识别能力,当然这个就需要充值算力了。

有小伙伴可能会说,剪映也能免费识别字幕呀~

确实,在剪映里面直接生成字幕会更加方便。但是剪映有不少局限性,比如不能翻译文本、不支持日韩等小语种的识别,时长限制,编辑不方便等等~

理由2:准确度超高

33字幕是基于Whisper模型打造的,它的识别准确度非常高,尤其是英语,更是接近真人的识别水平。

在很多测试用例中,我们发现它的表现甚至比很多商用的模型要更出色,我们的网站主页也有一些比较的测试案例,感兴趣的朋友可以自行看看。

当然,识别模型本身也有不少问题,比如有时候时间轴不准,出现幻句等。

针对模型出现的问题,我们做了很多优化处理,特别是 FasterWhisper 引擎,优化后的时间轴会准确很多。

理由3: 强大的编辑能力

大家知道,目前语音识别是不可能做到100%准确的。因此后期人工参与编辑是必不可少的,你会发现,有一个好用的字幕编辑器,才能让你真正实现事半功倍,这也是我们花了非常多力气的一部分。

对于机器识别可能会碰到的问题,总结一下大概有:

断句太长或不合理

时间轴不正确

出现错别字

对于断句不合理的问题,我们做了智能断句,你可以设置最大句长,33字幕会根据这个参数来优化每句的长度:

在优化之后,本地识别的时间轴问题基本得到了解决,但是也不能保证100%没有问题,这个时候,你依然可以通过波形图,来可视化微调时间轴:

另外,我们还提供了许多实用的小功能,来提升你的处理效率:

理由4:  独家台词搜索功能

如果你想构建一个台词搜索引擎,那目前可能就只有33字幕提供了这个能力了。利用这个功能,可以便捷地搜索一些外语短语单词,或用来剪辑台词对应的视频片段,

33字幕会自动解析、全文索引字幕内容,而且支持双语字幕和多语言。

相信这个功能对于视频创作者和外语老师们,将非常有用。

理由5:  更强的AI文本翻译

普通的字幕软件,一般只是集成了其中一家机器翻译接口提供商,然后前端按字数向用户收费。

而33字幕,则是直接集成了多家机器翻译平台,让用户可以填入自己申请的接口key,这样做可以让大家以最低的成本去使用机器翻译,如果使用量没有超过平台的限度,甚至可以永久免费去使用。

比如使用百度翻译+腾讯翻译,每月就有600w字符的额度,对于一般的使用情况,已经完全够用了,可以不花一分钱永久用下去。

通过自己的账号来使用翻译功能,没有中间商挣差价,33字幕也不会收取任何算力费用。

除此之外,我们还支持了目前领先的大语言模型来做翻译,OpenAI 的 ChatGPT 和 国内的智谱AI都有支持,用大语言模型来做翻译,如果提示词设置得当,甚至能达到专业译者的水平:

大语言模型翻译的提示词是完全开放的,方便大家可以进一步去优化翻译效果:

理由6: 一站式压制字幕

只需要33字幕这一个软件,,就可以一站式为视频加上字幕,不管是打包软字幕还是硬字幕都是支持的。

并且还能设置和实时预览字幕的样式,不用切换到视频后期软件就能一键给视频加上字幕了。

适合谁用?

视频创作者:带字幕的视频往往会具有更好的完播率,可以帮助观看者更好地理解内容,尤其在地铁和公交车等一些公共场合中观看视频的时候。

外语老师:通过33字幕构建台词搜索库的能力,在教学中引入优秀影片中的对白作为案例,让课堂变得更加生动有趣。

视频搬运或出海:把海外的视频加上中文字幕,或给中文视频加上外语字幕。

专业翻译:利用33字幕对于外语准确的识别能力、LLM翻译和字幕编辑器,能够极大提升视频或音频的翻译效率。

追剧达人:很多海外剧不带字幕,可以通过33字幕的实时预览和翻译功能,就不需要等字幕组的字幕了。

学生或白领:利用33字幕的音频转写能力,把教学视频或会议音频转成文稿、利用AI总结内容,来提升学习和办公效率。

更多的使用场景,等待你的探索~

如何使用本地识别?

33字幕是目前唯一一个同时集成了 Whisper.cpp 和 FasterWhisper 两种本地识别引擎的软件,这两个引擎的区别主要是:

Whisper.cpp 同时支持在 Apple M 芯片和 Nvidia Cuda 平台上启用 GPU 加速处理,这样可以大大增加识别速度,而FasterWhisper目前只支持cuda加速,但是使用 FasterWhisper 能够获得更加准确的时间轴。

如果你是Mac设备,建议先试一下 Whisper.cpp;如果有 Nvidia 显卡,建议首选 FasterWhisper。

只要安装好本地模型,不管你要给多少音视频转文本或生成字幕,都不会产生算力费用,可以随心用。

安装步骤也非常简单:只需要把模型文件放到相应的目录下就可以了,具体步骤可以参考网站上的教程引导。

http://docs.33subs.com/#/asr_local

除了上面提到的功能特点,33字幕还能进行AI总结、批量处理、按台词快速剪辑音频视频等强大的功能,具体欢迎去下载体验,篇幅有限,就不一一介绍了。

软件下载:https://www.33subs.com/



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3