视频版大爆炸来了,剪辑可精准到每个字,支持中文 Demo 可玩,老罗:打钱

35小吃技术网 推荐阅读 2023年09月25日22时55分46秒 97 0

现在把视频剪下来,每一个字都已经准确无误了!

只需点击你想要删除或留下的单词,AI 就可以在几分钟内为你制作一个新视频。

这个操作有点像大爆炸功能。 老罗:赚钱!

无论是MV、采访、电影片段、各种类型的视频,无论有没有字幕,都轻松搞定。

网友们纷纷开始尝试。 网比如让瑞克罗尔做鬼~

甚至可以举办中文视频。 实测Demo发现竟然直接翻译成英文了。

不过,这并不影响整个操作。 毕竟背后的模型支持包括中文在内的多种语言。

视频版大爆炸来了,剪辑可精准到每个字,支持中文 Demo 可玩,老罗:打钱-第1张图片

精确到每一个字来剪切视频

只需三步,即可轻松完成精准文字的视频编辑——

视频版大爆炸来了,剪辑可精准到每个字,支持中文 Demo 可玩,老罗:打钱-第2张图片

上传视频,选择已删除/留下的单词,下载视频。

发布了三个例子,烹饪视频、小扎访谈、《Just Do IT》……

当然,你也可以自己尝试一下,它可以识别各种语言。 比如,以一段经典对话让子弹飞为例。

绿色表示保留,红色表示删除。 您有三个选项:剪辑、选择所有单词、重置。

选择任意保留字后,您可以“剪切视频”。 在这里选择两条转义线。 网不到十秒,编辑就完成了。

画面切换可以说是非常流畅了~整个Demo都是在T4上运行的。

基于模型的

这是荷兰开发者基于.

它是一个语音识别神经网络,于去年 9 月开源。 经过68万小时的多语言、多任务监督网络数据训练,其鲁棒性和准确性接近人类水平。 它可以做多语言转录,其他语言会被翻译成英语。

它基于端到端的实现架构,无需任何微调。 输入音频被分成30秒的块,转换为梅尔倒谱(音频特征提取方法之一,log-Mel),然后传递到编码器。

好了,这里先试一下demo,感兴趣的朋友可以点击:

参考链接: