ElevenLabs推AI工具“AI Dubbing”可将语音翻译成20多种语言

时间: 2023-12-29 20:18:09 |   作者: 爱游戏app最新版

  - ElevenLabs推出AI工具“AI Dubbing”,可将语音翻译成20多种语言,同时保留原语音者的声音。

  - “AI Dubbing”可在几分钟内完成语音翻译,过程自动化,用户只需上传文件。

  - ElevenLabs不是唯一探索语音翻译的公司,OpenAI、Meta等也在该领域活跃。

  站长之家(10月11日 消息:美国初创公司ElevenLabs日前推出了一款名为“AI Dubbing”的产品,该产品能将任何语音内容翻译成20多种不同的语言。这一工具面向所有平台用户开放,被视为是改变语音配音领域的创新之举。

  “AI Dubbing”最大的意义在于,它可以为内容创作者打破语言障碍,将内容全球化。ElevenLabs CEO Staniszewski表示,他们与数百位内容创作者合作测试并迭代此功能,目的是将内容配音并使其触达更广泛的听众。从独立创作者到影视工作室都可从中受益。

  该公司声称,AI Dubbing工具可以在几分钟内完成高质量的语音翻译,同时保留讲话人原有的语气与情感。对用户而言,整个翻译流程是自动化的,只需要在ElevenLabs平台上选择语言、上传文件即可,无需人工参与其中。

  在这个AI时代,探索语音翻译的公司不止ElevenLabs一家。比如OpenAI最近使ChatGPT支持语音交互后,也可通过语音转文本和文本转语音的方式来进行不同语言之间的翻译。另外,Meta最近也推出了SeamlessM4T多语言基础模型,可实时进行语音或文本的翻译。

  目前,ElevenLabs的“AI Dubbing”支持20多种语言,包括中文、葡萄牙语、日语等,为用户更好的提供了广泛的全球化选择。ElevenLabs CEO表示,该配音工具可翻译任何时长的视频或音频,同时保留语音者的声音及情感,是同种类型的产品中质量最高的。在语音合成领域,MURF.AI、WellSaid Labs等公司也在探索基于AI的语音技术。

  根据市场预测,语音合成等相关工具2022年市场规模为12亿美元,预计到2032年将达到近50亿美元,复合年增长率超过15%。AI配音工具的出现无疑为这一个市场带来了更多可能性。

  11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,稳定性很高,让您的云端之旅更加畅享。快来腾讯云选购吧!

  Spotify正在进行AI语音翻译试点项目,将博主的播客翻译成用户的母语。该功能使用了OpenAI最近发布的语音生成技术,能保持原始发言者的风格和特点,提供更真实、自然的听觉体验。Spotify希望能够通过这个功能帮助博主将他们的故事传递给全球更多的听众,同时也会按照每个用户和博主的反馈一直在改进和扩展。

  人工智能公司ElevenLabs推出了名为Projects的长篇音频生成和编辑平台。该平台汇集了公司在长篇语音合成、音频和并行音频生成等领域的研究成果,使创作者、出版商和独立作者能够在几分钟内为整个对话段落、新闻文章甚至有声书生成配音,全部在一个工作流程中完成。该产品简单高效的工作流程和强大的语音生成能力,令ElevenLabs在语音合成领域处于领先地位。

  PikaLabs在Discord上部署的AI视频生成器增加了两项新功能。第一项名为“视频字母化”,可以将不同样式的字母和文字嵌入到短视频中。PikaLabs正不断丰富其AI视频生成器的功能,为用户更好的提供更多定制化选择。

  Spotify正在测试一种新的方式,让播客主持人使用人工智能技术,以自己的声音模拟不同语言版本,以便触达其他语言的听众。图片来源于SpotifySpotify与一些播客主持人进行了合作,使用人工智能技术将他们的英语内容翻译成了其他语言版本,例如西班牙语、法语和德语。「我们始终相信,深思熟虑的AI应用能够在一定程度上帮助建立更深入的听者和创作者之间的联系,这是Spotify解锁人类创

  ABBYY最新发布的智能自动化状况报告揭示了AI领域的最新趋势,尽管当前的经济情况对企业支出构成挑战,但AI投资却飙升了80%以上。报告的调查对象包括美国、英国、德国和法国的IT领袖,他们的见解为我们大家带来了有关AI优先事项和经济影响的重要信息。营销、产品研究开发、销售和物流等影响收入的业务正在成为压缩的三到五年AI路线图中的主要关注点。

  StabilityAI发布了最新的语言模型StableLM3B,该模型是为便携式数字设备设计的,参数规模为30亿,比行业通常使用的70亿参数模型要小,具有更高的性能和可移植性。StableLM3B具有较小的体积和高效性的优势,需要更少的资源和较低的运行成本,使其对大多数用户来说更加可承受。该模型已在HuggingFace平台上发布,可以下载权重进行尝试。

  AI视频编辑初创公司Captions发布了一款名为Lipdub的新应用,用于将视频片段翻译成28种语言。该应用支持多种语言,包括法语、印地语、西班牙语、意大利语、葡萄牙语、日语等,还可以将视频翻译成德克萨斯俚语、Z世代用语、海盗语和婴儿语。AI配音的初创公司引起了众多投资者的兴趣,像英国的Papercup和以色列的Deepdub等初创公司已筹集了数百万美元。

  在线影视平台Tubi日前宣布,将推出一款基于ChatGPT的智能聊天机器人RabbitAI,以提升用户的内容发现和交流体验。这标志着娱乐内容推荐郑重进入AI时代。随技术的进步,基于AI的创新应用有望不断涌现,给用户所带来更好的个性化体验。

  一家初创公司refuel上线了一个AI标注数据的开源工具Autolabel,它能利用LLM自动对数据来进行标注,大大简化了数据标注流程。Autolabel支持主流的LLM提供商,并可为开源和私有模型提供支持。在接下来的几个月中,开发者承诺将向Autolabel添加大量新功能:如支持更多LLM进行数据标注;支持更多标注任务,例如总结等;支持更多的输入数据类型和更高的LLM输出稳健性;让用户能试验多个LLM和不同提示的工作流程。

  微软发布Windows11大更新,新增CopilotAI助手、AI增强画图工具等功能。如果您想立即获得今天的重大Windows11更新,能进入「设置」「Windows更新」,并打开「获取最新更新,一经推出立即获取」的选项。元象开源70亿参数通用大模型XVERSE-7B,免费可商用元象开源了70亿参数通用大模型XVERSE-7B底座与对话版,这是一款全开源、免费可商用的模型,相比之前的XVERSE-13B,7B版本更小巧

  Adobe Photoshop的这一功能允许用户将普通照片转换成卡通风格。通过几个简单的步骤,用户都能够利用Photoshop中的工具和效果,如Poster Edges和Liquify,来创建独特的卡通和漫画效果。功能包括将照片转换成智能对象以进行非破坏性编辑,应用海报边缘效果,以及保存卡通化后的照片。

  CodeArts Snap是华为云自研的基于盘古研发大模型的智能开发助手。它通过强大的软硬件算力底座、深厚的软件分析与安全可信基座、以及坚实的研发数据积淀,为开发者提供代码生成、知识问答、代码检查等多种智能化研发服务,大幅度提高软件研发效率,释放研发生产力。

  InternVL通过将ViT模型扩展到60亿参数并与语言模型对齐,构建出目前最大的14B开源视觉基础模型,在视觉感知、跨模态检索、多模态对线项state-of-the-art性能。

  TableX是一款能够从PDF或图片中提取表格数据的工具。用户可通过上传文件或拖放文件做相关操作,数据处理过程安全可靠。提取完成后,用户可下载提取的数据并以Excel格式保存。产品定位于提高数据提取效率和准确性的生产力工具。

  ChatPuma是一款AI动力的无代码聊天机器人构建平台,可让您在几分钟内创建并部署到您的网站。它旨在利用您网站的有关数据,通过可嵌入的聊天气泡为您的客户提供实时准确的答案。

  Colorcinch是一个免费的网页图像编辑工具,无需注册就可以使用。它提供了图片滤镜、贴图、文本、涂鸦等多种编辑功能,能轻松地个性化修改图片。用户都能够直接在浏览器中打开图片进行编辑,支持PNG、JPG等多种格式,还可以将图片转化为卡通效果。此外,Colorcinch还提供免费的图片托管服务。总体来说,这是一个简单易用、功能丰富的在线图像编辑工具。

  PHO.TO是一个可以一键生成卡通头像的在线工具,它使用了世界上首个基于AI的照片转卡通技术,用户只要点击一个按钮,它就可以在专业卡通画家的质量水平上,将照片转换成卡通图像。该工具支持对单人、多人甚至全身照片进行卡通化处理,还可以与Photo Lab的其他效果组合使用,提供丰富的调整选项。用户不但可以获得卡通形象的个人头像,还能制作适用于各种场合的有趣卡通图像。

  GPThelp是一款定制化网站聊天机器人,可以依据您网站的内容做训练,让您的客户根据您的网站、文件、普遍的问题等获取即时答案。用户都能够自行定制设计,改变AI的行为和监控对话。通过输入网站地址,GPThelp将自动获取网站上的所有页面,并在网站内容上训练您的AI聊天机器人。

  RepBot.ai是一款全自动平台,可监控客户评论,生成定制回复并在Google和Facebook上发布,无需任何操作。它还提供AI支持的细致报告,帮助用户保护品牌声誉,提供卓越的客户服务。

  DoodleMaker是一款利用AI技术自动将任何文本或内容转换成色彩丰富的涂鸦动画视频的工具。它集成了无限的文本转语音、语言翻译、完备的素材库等技术,可极大简化视频创作流程,无需技术经验即可轻松制作高质量的涂鸦视频。

  Beam AI是一款面向总承包商、分包商和供应商的全自动化量尺软件。使用Beam AI自动化您的量尺工作,节省90%的时间,并能处理多达30%更多的估算。

  elsAi 是一款功能强大的 AI 助手工具,能够在一定程度上帮助用户提升工作效率和生产力。它具有智能翻译、语音识别、智能推荐等多项功能,支持多种语言和场景应用。elsAi 定位于为用户更好的提供便捷的 AI 辅助工具。

  Eleo是一个基于先进人工智能技术打造的写作、创作助手。它能够在一定程度上帮助用户大幅度提高写作效率,同时激发创作灵感。Eleo的核心功能包括:文章写作、翻译、创意激发、图像生成、聊天机器人等。相比其他聊天型人工智能,Eleo提供更全面、强大的创作功能。它易于使用,支持多种语言,可以完全免费使用。Eleo是作家、学生、营业销售人员等创作者的好助手,能释放更多创作时间。

  StockDreams.ai是一个使用人工智能技术为各种业务生成高转化图像的在线秒内为您的商业、广告、网站或社会化媒体帖子生成引人注目的图像,以吸引更多潜在客户的眼球。

  Experience Love Events是一家位于佛罗里达州的全方位活动和婚礼策划公司。我们拥有超过十年的经验,致力于提供全方位的活动和婚礼策划服务。我们的团队由最优秀的活动和婚礼策划师组成,努力打造无压力、个性化和令人难忘的活动。我们拥有丰富的作品集,对我们的工作充满热情。咱们提供婚礼策划、活动策划、婚礼主持、婚前辅导、活动和婚礼租赁、装饰服务、DJ/司仪、摄影、摄像、豪华轿车服务、餐饮、照相亭、调酒师、活动文具和标识、发型和化妆服务、服务员等服务。我们在目的地婚礼策划和海滩婚礼策划方面拥有特殊的技能和丰富的经验。我们的目标不仅是称为最好的活动和婚礼策划公司,更是成为佛罗里达南部及周边地区最优秀的活动和婚礼策划公司。

  Voscribe 是一款免费转录工具,可以将音频文件转换为文本。它支持将 MP3 转换为文本、MP4 转换为文本等多种格式,并能在 2 分钟内以 95% 的准确度提供可编辑的转录文本。

  crAion是一个使用先进AI技术分析儿童绘画作品的创新应用程序。它可以深入挖掘儿童内心世界,提供他们思想和感受的独特见解,所有这些都来自他们创作的艺术品。该应用程序的基本功能有:1) AI分析引擎,可以解析每个绘画作品,揭示儿童绘画中隐藏的意义和情感;2) 云端数字绘画作品库,可以存储和组织儿童的创作历程;3) 家庭共享功能,可以与家人分享宝贵的创作时刻;4) 安全隐私保护。crAion让父母以全新的视角去理解孩子的发展和想象力,是探索儿童创造力世界的完美伴侣。

  Ideamap 是一个用于头脑风暴的可视化工作空间,团队可以在此协作并利用人工智能来提升创造力。它提供了多种工具和功能,包括思维导图、在线白板、共享笔记和 AI 创意推荐。小组成员能够最终靠多人实时协作,在虚拟的工作空间中集思广益,快速产生创意并整理归纳,有效推动项目的发展。

  Photo AI Studio 是一款使用先进的人工智能图像生成技术的专业 AI 照片工作室。只需一张照片,即可立即生成数百张照片。加入数千名满意的客户,立即获取您的下一张个人资料照片!

  优酷上线一项全新的 AI 功能 ——AI 搜片,号称全网首个 AI 对话类影视搜索引擎。这款工具拥有强大的搜索功能,不仅覆盖了全网百万级的影视剧实体信息,还融合了万亿条文娱相关知识词条。用户都能够通过多轮对话实现模糊搜索、影视问答、剧情检索等功能,无需具象化的问题就能完成。这一功能的推出将极大的提升用户在优酷平台上的搜索体验,使影视内容的查找和推荐更加智能化和个性化。