当前位置

QQ头像 > 头像教程 >

TED演讲者英语清晰,噪音也少:Ted_2015U.自动生成的字幕文件

点击链接查看效果

我的生活中经常有一些痛点。比如坐地铁的时候,用耳机看没有字幕的视频,会觉得不舒服。因为噪音太大,你听不到视频里说的内容,也不能把声音调的很大,很伤耳朵。看英文视频的时候,如果你没有中文字幕,英文又很差,你就很难看懂。如果加了英文字幕,稍微有点英文水平的人或许能看懂。在日常生活中,你可能有一个录音文件,很想自动转换成文本。

以上痛点不痛不痒,但是如果有工具可以自动帮我们做一些语音转文本的自动化任务,那就太好了。根据视频的语音信息,youtube自动添加字幕已经很久了,在youtube上可以自动翻译。如果将单词识别为文本,则有很多产品,例如科大讯飞和百度。但是,自动化软件将很长的音频转换为文本或自动为视频添加字幕的情况并不常见。科大科大讯飞应该有这样的软件,不知道要不要收钱。

我是做软件的,生活中的这些痛点让我觉得还是利用现有资源给文字加字幕或者音频比较好。所以花了一些时间来做一个演示。对于一些比较好的视频,比如语音视频,效果还是不错的。

我使用 TED 演讲做了一个演示。 TED演讲者英语清晰,噪音低:

Ted 视频来自:AomawaShields_2015U.mp4

查看自动生成的字幕文件:ted80001.srt

在我的python脚本中,基本思想是:

(1)把长语音文件剪成小语音文件。

(2)直接用百度语音识别小文件从语音转文字

(3)小语音文件包含语音的开始时间和结束时间,所以可以加字幕

其实,把长文件处理成小的语音文件并不容易。经过一番思考,开发了以下切割工艺:

(1)提取wav文件的数据并对数据做一些平滑处理

(2)规范化数据

(3)设置一个阈值,定义用户的暂停阈值(归一化后,我取0.2)。对于每一个超过这个阈值的语音值,都认为作为说话,低于此为停顿。计算连续停顿的长度和连续说话的点数。

(4)对于所有统计长度的数据,按照停顿的长度排序

(5)按照排序后的数据进行剪切,越靠前的越多应该剪切。剪切什么时候停止?剪切后所有小音频文件小于一个就会停止一定指定的试用长度。基本上根据我的经验,我可以将这个值设置为17S左右。

(6)有了这些小音频,就可以利用现有的语音识别技术进行语音转文本识别,甚至可以添加字幕。

您以后还可以添加一些自动翻译。

如果你是程序员,请参考我的项目:github

.

想听剪辑效果,点击下方链接看百度网盘。切割文件按ID_开始时间_结束时间命名(ID从1开始)

以后学英语或者听音乐,可以把长音频剪成小句,方便很多。

TED 音频文件拆分后的小音频和无伴奏合唱

无伴奏合唱我只在乎你剪了 TED 后的小音频

中文识别,小蝌蚪找妈妈:

睡前故事,

小蝌蚪在找妈妈,

小蝌蚪在池塘里游泳,

当我遇到妈妈带着一群小鸭,池塘里有水时,小鸭跟着鸭妈妈不停地叫她妈妈,

我想知道我们妈妈下课后在哪里,

他们来找我妈妈问,鸭妈妈,你知道我们妈妈长什么样吗?

你妈妈,她头上有两只大眼睛,

嘴巴又大又宽,

小蝌蚪觉得大禹像妈妈抖音自动生成字幕,赶紧追上去给妈妈打电话,大禹笑着说我不是你妈妈,

你妈妈有四条腿,

小蝌蚪看到乌龟有四只脚,

赶上大喊一声,

妈妈,乌龟笑着说,我不是你妈妈,你妈妈的肚子是白的,

小蝌蚪看到大白鹅很高兴,想上去,

妈妈,大白鹅说你妈妈穿绿衣服,

会叽叽喳喳唱歌,小蝌蚪看到一只青蛙坐在荷叶上,穿着绿色的衣服,

青蛙呱呱呱呱地说抖音自动生成字幕,我的孩子们快来了,我是你的妈妈,为什么我看起来和你不一样?

长大后会像妈妈一样,

小蝌蚪终于找到了妈妈,在水里开心地游着,

后来蝌蚪慢慢长出四只脚,尾巴消失了,换上了绿衣服,变成了真正的青蛙。

他们每天都在岸边遛害虫,

人类的好朋友,

英文识别结果:

我们的,

那个,那个,

我在宇宙中寻找另一个生命存在的星球,

用肉眼,甚至我们目前拥有的最强大的望远镜都无法看到这个星球,

但我知道它就在那里,

理解自然界中发生的矛盾将有助于发现,

在我们的星球上,有水就有生命,

所以我们寻找与恒星距离合适的行星,

在这张图表中以蓝色显示的不同温度恒星的距离,行星可能足够温暖,水可以在其表面流动,有可能存在生命的湖泊和海洋,

一些天文学家将他们的时间和精力集中在寻找与恒星距离如此远的行星上,

我的工作占据了他们的工作位置,

我模拟了可能影响地球的气候,

这就是为什么这很重要,除了与恒星的距离之外,还有许多因素可以控制行星是否可以支持生命存在,

以金星为例,

它以罗马爱与美女神的名字命名,因为它在天空中连续出现是良性的,

但航天器测量揭示了一个不同的故事,

地表温度接近华氏九百度五百摄氏度,

足以熔化铅,

它的厚大气而不是它与太阳的距离是导致类固醇的温室效应从太阳捕获热量的原因正在灼烧行星表面,

现实与对这个星球的最初看法完全矛盾,

从我们太阳系的这些教训中,我们了解到行星的大气对其气候和承载生命的潜力至关重要,

我们不知道这些行星的大气是什么样的,因为与它们的恒星相比,这些行星在游戏中太小了,离我们太远了,

例如,可以支撑地表水的最近行星之一被称为至少六六七cc触摸一个迷人的名字写下我的电话号码在二十三光年外,

所以超过一百万亿英里,

试图测量经过其主星前方的轴行星的大气成分,

这就像试图看到一只果蝇从汽车的前灯旁边经过,

他们现在想象那是一百万亿英里外的原因,而你想知道苍蝇的准确颜色,

所以我使用计算机模型来计算一个行星需要什么样的大气层,你有适合水和生命的气候,

这里是 sanartist 对开普勒 60 行星的概念,供您参考,

距离地球 1200 光年,仅比地球大 40%,

或者在获得过多资助的工作中发现 IT 可能足够温暖,可以让开放水域的许多类型大气和轨道方向像功能望远镜一样生活,以便在这个星球上跟踪以寻找生命迹象,

行星表面的冰对气候也很重要,冰吸收更长的红色波长的光并反射更短的蓝色光,

这就是照片中的冰山看起来如此蓝的原因,太阳发出的红光在穿过冰层的过程中被吸收,只有蓝光使它一直到底部,

当我们看到蓝色的妻子时,反射回我们的眼睛,

我的模型表明,围绕较冷恒星运行的行星实际上可能比围绕较热恒星运行的行星更暖,她还提出了另一个矛盾,即冰吸收了来自较冷恒星的较长波长的光,而这种光是能量,

加热冰块

使用气候模型来探索这些矛盾如何影响行星气候对于寻找其他地方的生命至关重要,

这并不奇怪,

我的专业,

我是非洲裔美国女天文学家,是一位受过古典训练的演员,喜欢化妆和阅读时尚杂志,因此我具有独特的优势,可以欣赏大自然中的矛盾,

以及它们如何为我们寻找下一个生命存在的星球提供信息,

我的组织后起之秀女孩向有色人种的中学女生教授天文学,

使用戏剧写作和视觉艺术,

这是另一种矛盾的科学和艺术,它们通常不会结合在一起,但将它们交织在一起可以帮助这些女孩将自己完整地展现出来,也许有一天,

加入那些充满矛盾的天文学家行列可以用一个背景一劳永逸地发现我们在宇宙中真的并不孤单,

谢谢你,

上一篇:临摹素描头像 下一篇:没有了