自动翻译视频中的音频:方法如下

Updated July 23, 2024
Fanyi audio - Smartcat blog
Smartcat covers all your language needs with AI translation, AI content generation and AI human workflows.

您所在的公司很可能希望让视频内容触达更广泛的受众。无论是内部培训视频、面向客户的产品教程,还是营销视频,您都可能正在考虑为视频添加字幕翻译和多语言配音服务。

好消息来了:从视频中翻译音频已不再是曾经的难题。无需为团队增聘母语者或雇佣翻译机构,您也能轻松实现。具体方法如下:

为什么视频翻译对国际观众如此重要?

受众群体正变得比以往任何时候都更具全球性。对于企业而言,若想触达全球受众并提升员工或客户的参与度,增加多语言音频内容无疑是提升互动率、订阅量和营收的有效途径。

看看奈飞在非英语内容上投入了多少资金。 据其全球化总监凯西·罗克尼透露,在新增27种语言服务后,该平台的订阅用户数量两年内实现了翻番。

近日,Peloton在其产品中新增了德语和法语配音课程。根据其常见问题解答,他们将扩展其配音课程服务将逐步增加更多语言选项。

其优势显而易见:

  1. 字幕和字幕卡有助于提升视频观看量达80%

  2. 翻译内容的互动率可达未本地化内容的12倍

  3. 企业可通过50%的生产力提升,同时还能实现50-70%的成本节约

字幕和配音带来的好处不仅限于娱乐行业。对于希望拓展新市场、留住现有客户或通过多语言培训视频提升员工学习满意度的品牌而言,同样能从中获益匪浅。

如何从视频中提取音频

想开始为视频中的音频添加字幕吗?以下是简易的五步操作指南:

1. 将原始音频转录为文字

翻译音频文件的第一步是仔细转录视频的原始音频。这可以通过人工完成,也可以借助自动视频转录工具实现:

  1. 人工转录需要人工转录员聆听音频/视频录音,并准确录入所听内容。人工转录员的费用为每分钟1-1.5美元。

  2. 另一方面,自动转录则通过转录工具将音频自动转换为文本。必须承认,其速度远超人工且成本更低(每分钟音频仅需0.10-0.20美元)。加之众多科技巨头正致力于自动转录技术研发,该技术将持续优化并降低成本。

关于自动视频转录的简要说明

自动转录技术利用语音识别将口语转化为书面文本。尽管尚未臻于完美,但当前计算机模型在解码语音方面的表现已接近人类水平(前提是音频类型匹配)。

自动转录功能真是聪明绝顶。我们必须承认,它比人类快得多。自动转录对您来说够用吗? 答案通常是肯定的,但为方便您决策,可免费注册并亲自体验

2. 审阅并编辑您的字幕

获得转录文本后,您可以核对原始文本,确保转录工作准确无误。

转录需要达到多高的准确度?这取决于您的具体需求,但通常您需要一份接近逐字准确的完整转录稿。

注意:尽管大多数自动转录工具的准确率可达90%以上(Smartcat的AI OCR转录准确率为95%),但系统有时可能无法识别专有名词。此外,若发言者带有口音,工具可能无法捕捉到每个语调变化,因此核对原始文本至关重要。

3. 翻译您的字幕

通过精修后的转写文本,您现在可以将其翻译成目标语言。具体可采用以下方式:

  1. 专业语言学家提供的翻译服务

  2. 人工智能翻译工具

  3. 两者的结合

该如何选择?这仍取决于您的内容和目标。若您拥有充满文化典故和幽默元素的高优先级内容,且这些内容高度依赖语境,那么仅使用AI工具可能就足够了。媒体本地化既是技术操作也是创意实践,您需要专业人士来确保独特风格和声音得以精准传达。

字幕制作时需要考虑一些特殊因素。你需要顾及字幕所占用的空间和时间。这便涉及到不同的考量点:

什么是阅读速度?

阅读速度是指预计观众阅读字幕所需的时间。显然,成人和儿童的阅读速度可能不同,因此您应该对目标观众的需求有清晰的认识。一个粗略的估计是,每行文字分配 2 秒钟,以实现轻松的阅读速度。

与音频的时间同步性是什么?

如果字幕与音频的时间差超过几帧,观众可能会感到分心或恼火,因为某些内容在屏幕上停留时间过长,或者他们错过了某些内容。

准确性

您需要忠于原文,提供最准确的翻译。 但高效翻译的关键在于把握平衡点,并灵活调整以确保体验流畅无缝。

4. 检查您的翻译

翻译完成后,必须对内容进行准确性、文化适宜性、篇幅、间距和时效性的审核。以下是审核译文时需注意的实用技巧:

长度与间距

尽量保持单行显示,屏幕上同时最多显示两行。

时间控制

确保时间同步也很重要。 字幕应在发言者开始讲话时出现,并在发言者停止讲话后立即消失。

质量保证 (QA)

发布前请测试字幕和视频。 与当地相关方或合作伙伴共同审核也是明智之举。他们可核查字幕行在规定时间内能否读完,并复核语义准确性。

5. 创建翻译后的音频

迄今为止,企业与创作者在进军全球市场时仍面临着巨大的成本与时间障碍。尽管生成式人工智能语音技术能够快速生成外语语音,但并不能确保生成的音频在跨文化传播中准确传达原始信息。
纯自动化系统缺乏传递真实感和情感冲击力的能力,而这正是品牌传达愿景与意图所必需的。此外,当前生成式人工智能语音技术的最新案例尚无法解决这一问题,因为它们通常仅限于单人发声,且除语音外不包含其他音频内容。最后一步是生成目标语言的新音频,可通过以下方式实现:
  • 配音演员录制翻译后的剧本

  • 文本转语音技术

  • 人工智能配音实现自然效果

通过Smartcat字幕编辑器简化工作流程

Smartcat全新推出的AI驱动字幕与多语种配音工具,是业内首款能够自动转录音频或视频源内容、将其翻译成目标语言并支持翻译编辑的配音工具。

众多财富1000强企业采用Smartcat字幕编辑器构建更高效、更流畅的工作流程。通过Smartcat平台,用户只需上传视频、选择语言(支持280余种语言)、运用AI技术完成转录与翻译、进行审阅编辑,即可为多语种视频添加配音。

以下是其工作原理的简化概述:

  1. 将视频上传至Smartcat平台

  2. 让AI自动转录音频内容

  3. 审核生成的转录文本准确性

  4. 选择语言并使用AI翻译功能处理文本

  5. 根据需要审阅并编辑翻译后的转录稿

  6. p>
  7. 选择语言并使用AI翻译功能处理文本

  8. 根据需要审核并编辑翻译后的字幕

  9. 生成配有自然语音的AI配音版本

  10. 下载最终的多语言视频

  1. 将您的视频上传至Smartcat平台

2. 让人工智能自动转录音频

3. 检查生成的字幕是否准确

4. 使用人工智能翻译将文本转换为目标语言

请对目标语言文本和时间码进行必要的调整,如同您对源文本分段所做的那样。需要注意的是,与源文本分段不同,翻译后的分段不一定与精确的时间码完全匹配。

不过,借助视频预览功能,您仍可通过原始文本结构和视频上下文确保定位准确。

5. 根据需要审阅并编辑翻译后的文字稿

6. 生成采用自然语音的人工智能配音版本

7. 下载最终的多语言视频

音频翻译的5个最佳实践

  1. 自动化、自动化、再自动化:您可能需要翻译数百甚至数千个视频。若想将视频翻译成另一种语言,更不用说五种或十五种语言,这将是个相当繁琐的过程。 因此,您需要尽可能利用自动转录、配音和工具实现自动化。

  2. 从高质量源材料开始: 除了确保原始视频音频清晰、发音清晰等技术层面,还需确保源语言内容便于翻译。这将显著提高转录和翻译的准确性,并缩短上市时间。 此外,您还能轻松实现跨语言内容复用。

  3. 建立质量保障体系:翻译文本的质量审核流程至关重要。制定针对特定语言的风格指南以确保准确性与一致性,并严格执行这些规范。

  4. 关注阅读速度、音频时效与字幕同步: 视频内容中时间轴至关重要。确保译制音频与画面视觉元素及字幕叠加层精准匹配。

  5. 测试译制视频并评估效果: 定期进行效果分析是检验多语种视频是否达标的唯一途径。应借助母语人士或深谙目标受众的质量保证测试员收集反馈意见。

人工智能语音翻译案例研究

Smith+Nephew 字幕转录与翻译速度提升70%

史密斯+尼夫是一家跨国医疗设备制造商,为全球员工提供七种语言的电子学习培训视频。通过与Smartcat合作,他们得以:

Smartcat解决的挑战——通过实施Smartcat字幕编辑器和AI配音功能,团队得以:

  • 缩短文件准备时间: 通过自动从视频旁白中添加字幕的功能,史密斯+尼夫公司将字幕转录的文件准备时间缩短了70%。

  • 基于整体语境的协同协作:所有工作均在同一Smartcat工作区完成,翻译团队可无缝协作并实时保存进度。

  • 提升字幕转录与翻译准确性:团队发现通过在翻译前编辑视频字幕源语言文本,可有效避免错误。此外,他们能直接快速修改内容,无需再调用平面设计团队。

"当Smartcat推出新功能,能够自动从视频旁白中提取字幕,从而快速编辑源文本以实现完美的自动翻译流程和后编辑时,我们的文件准备时间瞬间缩短了70%。"史密斯+内夫翻译部门经理芭芭拉·费多罗维奇如是说。

如今,史密斯+尼夫公司的音频翻译业务由Smartcat的AI视频翻译工具统一管理。该平台作为项目经理、译员及所有参与者的核心枢纽,集成了自动视频转录、AI驱动翻译、字幕编辑器等功能,并支持100多种语言的自然语音输出。

结果:

  • 工作量减少70%

  • 每季度为每种语言创建15-20门新视频培训课程

  • 相较第三方供应商实现显著成本节约

阅读完整的案例研究

想了解更多吗?

接下来您可以这样做:

1. 注册Smartcat,吸引全球受众以留住并吸引客户。通过翻译您的音频内容,您将能够触达国际受众,并大幅提升用户参与度。

2. 立即注册Smartcat的14天免费试用,开始翻译您的音频内容。

使用人工智能翻译您的视频和音频文件
💌

订阅我们的新闻

电子邮件 *