4 月 2025 - 第126页共127页

1 4 月 2025

OneSky Localization Agent

什么是OneSky Localization Agent？

OneSky 本地化代理 (OLA) 是一个多代理人工智能系统，旨在提供卓越的自动翻译。只需提供简要说明，我们的 AI 代理团队——每个专家专注于翻译的不同方面——就会开始工作，提供 90% 类人且自然流畅的翻译。

如何使用 OneSky Localization Agent？

只需在 www.onesky.ai 创建账户。OLA 可以无缝地集成到您的工作流程中。连接的服务会触发 AI 代理自动执行本地化，并在任务完成后将结果返回。我们开发了一系列工具、知识库和编排能力，专门为我们的 AI 代理在集成、字符串提供和翻译阶段量身定制。

OneSky Localization Agent 的核心功能

比标准 AI 翻译更高的准确性 – 多 LLMs 结合实现最佳质量

90% 的翻译准确率 – 多个 AI 代理作为本地化团队共同工作

通过可选的人类后期编辑实现 100% 的自然翻译

相比传统人工翻译节省 75% 的成本

实时跟踪 AI 代理进度

与源代码管理系统的集成实现持续本地化和更快发布

1 4 月 2025

OpenAssistant

OpenAssistant 产品介绍

一款基于聊天的助手，能够理解任务，与第三方系统互动，并为此动态检索信息。

1 4 月 2025

OneAccord

什么是OneAccord？

OneAccord为教堂提供实时AI翻译服务，使教堂礼拜更加易于理解。

如何使用 OneAccord？

我们的实时AI翻译平台将帮助您打造一个人人都能参与的场所。通过我们的实时字幕和翻译功能，消除语言障碍，使您的教堂礼拜对听力障碍者也能够访问。我们的主持功能使您能够轻松达到100％的转录准确性。

OneAccord 的核心功能

无需下载

您的信众可以使用移动设备上的浏览器访问翻译和转录

应用您自定义的品牌和使用品牌化的网址

我们使用专为教堂环境训练的自定义AI模型，增强了对圣经术语的理解能力，减少了在语音理解中的错误，并更准确地解释了口述内容。

您可以同时使用文字和语音翻译

启用主持功能，以在翻译和发送之前纠正捕捉到的每一行文本的能力，进行快速的单词替换或编辑文本，以确保100％的准确性

下载转录

OneAccord 的使用案例

为非母语的信徒翻译教堂礼拜

使教堂礼拜对听力障碍者可访问

增进对圣经术语的理解

1 4 月 2025

Scribewave

什么是Scribewave？

Scribewave 是一个在线语音转文本工具，提供超过 90 种语言的音频和视频文件准确转录服务，拥有字幕、翻译和编辑功能。它专注于隐私、速度和易用性，非常适合记者和研究人员等专业人士使用。

如何使用 Scribewave？

使用 Scribewave 非常简单，只需上传你的音频或视频文件，AI 会快速将其转录为文本。你可以编辑文本、生成字幕，并以多种格式下载转录稿。

Scribewave 的核心功能

AI 驱动的语音转文本转录

支持 90 多种语言

隐私保护和 GDPR 合规

转录内容编辑功能

支持多种导出格式，包括 SRT 和 VTT

Scribewave 的使用案例

为研究人员转录访谈

为视频内容创建字幕

生成会议或讲座的转录稿

1 4 月 2025

Noiz AI

Noiz.ai 是什么？

Noiz.ai 是一款专注于语音合成与语音克隆的AI工具，依托自研的超大语音模型，能够快速生成与真人无异的声音模型，广泛应用于文本转语音、视频配音和多语言视频翻译等场景。

Noiz.ai功能

语音合成与克隆：用户只需录制3-10秒的声音，即可快速生成专属的语音模型，用于文本转语音、语音克隆、视频配音等。

情感化文本转语音：支持情感化的文本转语音功能，用户可以选择预设的情感标签或自定义情感强度和语调。

一键语言转换：能够将视频内容快速翻译成多种语言，同时保留原音质。

超强情感、语气克隆：精准复刻个性化表现，包括情感、语气等。

无需训练，直接克隆：用户无需进行复杂训练，即可直接克隆出想要的声音。

视频一站式翻译&改编：支持将视频中的人物对话进行中英文相互转换，并保留剧中人物的声音特点、停顿、语气等。

Noiz.AI应用

内容创作与视频制作：为视频、播客和动画添加个性化配音，提升内容吸引力；制作多语言版本的视频内容，拓展国际受众。

教育与学习：为教学视频添加个性化语音讲解，提升学习体验；生成多语言学习材料。

商业与营销：制作多语言广告和产品介绍视频，提升品牌在国际市场的影响力；用于智能客服系统，提供自然流畅的语音交互体验。

娱乐与创意：为创意内容（如动画、短视频）添加独特的声音效果；制作个性化的音乐视频。

跨境电商带货：轻松将产品介绍视频进行多语言配音，拓展海外市场。

影视剧二创配音：为影视剧片段进行创意配音，制作有趣的二创视频。

在线教育：制作高质量的在线课程视频，提供多语言学习体验。

广告制作：快速制作多语言版本的广告视频，提高广告传播效果。

社交媒体内容创作：为视频内容添加有趣配音，增加视频吸引力和互动性。

Noiz.ai使用方法

注册与登录：通过邮箱地址注册Noiz.ai账号，并登录到平台。

语音合成：在平台界面上选择“语音合成”选项，输入文本内容，并选择喜欢的音色和风格，即可生成高质量的语音输出。

视频配音：上传需要配音的视频文件，并输入对应的文本内容。Noiz.ai会根据文本内容生成配音，并与视频进行同步。

声音克隆：上传目标声音的音频片段，并输入此声音的名称、标签等信息。Noiz.ai会根据上传的音频片段进行声音克隆。

下载：完成配音后，将生成的语音或视频文件导出到本地设备。

Vocabulary AI

什么是Vocabulary AI？

词汇AI是一个语言学习平台，帮助用户通过即时翻译和个性化学习方法有效保存和练习新词汇。

如何使用 Vocabulary AI？

使用词汇AI的方法是：注册网站账号，安装浏览器扩展，在浏览网页时高亮单词，并通过艾宾浩斯学习法进行练习。

Vocabulary AI 的核心功能

轻松从任何网站保存新单词

即时翻译和定义

单词的音频发音

艾宾浩斯记忆法用于词汇记忆

支持Web和移动端多平台访问

Vocabulary AI 的使用案例

在阅读外语内容时轻松扩展词汇量

1 4 月 2025

TangoFlux

TangoFlux是新加坡科技设计大学（SUTD）与NVIDIA合作研发的一款先进的文本到音频（TTA）生成模型，该模型拥有约5.15亿参数，能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz立体声音频。TangoFlux不仅可以生成音效如鸟叫、口哨、爆炸等声音，还能生成音乐。

TangoFlux技术原理

变分自编码器: 使用VAE将音频波形编码成潜在的表示，从潜在表示中重构原始音频。

文本和时长嵌入: 基于文本编码和时长编码来控制生成音频的内容和时长。

FluxTransformer架构: 结合Diffusion Transformer (DiT) 和 Multimodal Diffusion Transformer (MMDiT)处理文本提示和生成音频。

流匹配: 学习从简单先验分布到复杂目标分布的映射，生成样本。

CLAP-Ranked Preference Optimization: 基于迭代生成偏好数据对，优化音频对齐。

TangoFlux主要功能

快速生成音频：TangoFlux能够在极短的时间内生成高质量的音频内容，适用于需要快速响应的应用场景。

高音质输出：生成的音频质量高，能够清晰再现各种声音事件，适合用于音乐、音效等多种类型的音频生成。

支持长音频生成：该模型能够处理长达30秒的音频生成任务，适合制作较长的音频内容。

多样化音效生成：TangoFlux不仅可以生成音乐，还能生成各种音效，如鸟叫、口哨、爆炸声等，适用于多种创意和娱乐项目。

TangoFlux应用场景

影视与游戏音频制作：TangoFlux可依剧本或场景描述，快速生成逼真音效、配乐及配音，缩短制作周期、降成本，提升作品音频质量，增强游戏互动性与沉浸感。

音乐创作灵感源：能按创作者设定，生成多样音乐片段，助力突破创作瓶颈，推动音乐创新，带来更多新颖作品。

VR与AR体验增强：依虚拟环境与用户交互生成实时逼真音频，提升VR游戏沉浸感，增强AR应用对虚实融合的感知。

广告营销音频创新：依广告创意与品牌形象生成独特音频，吸引消费者，唤起共鸣，提升品牌知名度与美誉度。

TangoFlux项目资源

项目官网: tangoflux.github.io

arXiv技术论文: https://export.arxiv.org/pdf/2412.21037

TangoFlux还采用了CLAP-Ranked Preference Optimization (CRPO)框架，通过迭代生成和优化偏好数据来提升模型的音频对齐能力。这种方法使得生成的音频不仅在质量上有保障，还能更好地符合用户的偏好和输入文本的意图。此外，TangoFlux的训练基于非专有数据集，使得模型更加开放和可访问，促进了进一步的研究和应用。

TangoFlux主要应用于多媒体内容创作，比如在电影、游戏、广告和视频制作中生成背景音乐、声效和配音，从而提高制作效率和降低费用。它的技术原理包括变分自编码器（VAE）、文本和时长嵌入、FluxTransformer架构等，这些技术共同支持了其高效的音频生成能力。

NineF AI平台

NineF AI平台产品介绍

平台拥有十多种来自海内外的知名人工智能公司研发的AI模型，我们致力于为客户提供免费的AI问答服务！在这里，您可以随时随地开启对话。

1 4 月 2025

DuckDB-NSQL

DuckDB-NSQL，一个专门为DuckDB数据库设计的文本到SQL的模型，你可以使用自然语言说描述你的需求，它会自动转换成SQL代码，也就是可以使用自然语言来和你的数据库聊天。

DuckDB-NSQL大大简化了数据库查询的过程，使得即使是不太懂SQL语言的用户也能轻松地与数据库进行交互和数据处理。

DuckDB-NSQL-7B模型是基于大约200,000条合成生成并验证的DuckDB SQL查询以及来自Numbers Station的超过250,000条一般性文本到SQL问题训练而成的。

DuckDB-NSQL不仅能生成有用的DuckDB代码片段，还能生成用于回答分析问题的SQL查询。

Hugging Face：https://huggingface.co/spaces/motherduckdb/DuckDB-NSQL-7B

DuckDB-NSQL主要特点：

1、自然语言处理能力：能够理解和处理自然语言输入，将用户用普通话语描述的数据查询需求转换成SQL查询代码。

2、针对DuckDB优化：专为DuckDB-NSQL数据库定制，能够充分利用DuckDB的特性和功能。

3、高效的查询生成：对于常见的数据查询任务，如创建表、选择数据、排序和过滤等，都能快速生成准确的SQL代码。

4、用户友好的交互：用户无需深入了解SQL语法，只需通过自然的语言描述就可以进行复杂的数据查询。

5、文档式的查询指导：模型知识覆盖DuckDB 0.9.2中记录的所有功能，包括官方扩展，类似于一个随时可用的文档查询工具。

6、低延迟：为了提供低延迟的SQL辅助特性，该模型采用了相对较小的模型大小，使得推理过程更快、成本更低。

7、广泛的应用场景：不仅能生成DuckDB-NSQL的代码片段，还能生成用于回答分析性问题的SQL查询。

8、开源和易于访问：模型权重在Hugging Face上完全公开，方便用户下载和使用。

9、本地运行支持：支持与llama.cpp一起在本地完全体验，提供了完整的本地运行指导。

1 4 月 2025

SubtitlesDog

什么是SubtitlesDog？

SubtitlesDog 是一个基于人工智能的字幕翻译工具，提供快速、高质量的视频内容翻译，支持100多种语言。

如何使用 SubtitlesDog？

上传您的字幕文件，选择一个AI模型，然后快速收到准确的翻译。

SubtitlesDog 的核心功能

可选择的AI翻译模型

专家级提示以实现专业翻译

支持多种字幕格式

批量上传多个文件进行翻译

可定制的输出格式

完美的时间轴同步

安全和私密的处理

SubtitlesDog 的使用案例

快速翻译视频字幕以便于全球受众观看。

AI工具网

AI工具网

OneSky Localization Agent

什么是OneSky Localization Agent？

如何使用 OneSky Localization Agent？

OneSky Localization Agent 的核心功能

OpenAssistant

OpenAssistant 产品介绍

OneAccord

什么是OneAccord？

如何使用 OneAccord？

OneAccord 的核心功能

OneAccord 的使用案例

Scribewave

什么是Scribewave？

如何使用 Scribewave？

Scribewave 的核心功能

Scribewave 的使用案例

Noiz AI

Noiz.ai 是什么？

Noiz.ai功能

Noiz.AI应用

Noiz.ai使用方法

Vocabulary AI

什么是Vocabulary AI？

如何使用 Vocabulary AI？

Vocabulary AI 的核心功能

Vocabulary AI 的使用案例

TangoFlux

NineF AI平台

NineF AI平台产品介绍

DuckDB-NSQL

SubtitlesDog

什么是SubtitlesDog？

如何使用 SubtitlesDog？

SubtitlesDog 的核心功能

SubtitlesDog 的使用案例

AI工具网

AI工具网

月度归档：4 月 2025

什么是OneSky Localization Agent？

如何使用 OneSky Localization Agent？

OneSky Localization Agent 的核心功能

OpenAssistant 产品介绍

什么是OneAccord？

如何使用 OneAccord？

OneAccord 的核心功能

OneAccord 的使用案例

什么是Scribewave？

如何使用 Scribewave？

Scribewave 的核心功能

Scribewave 的使用案例

Noiz.ai 是什么？

Noiz.ai功能

Noiz.AI应用

Noiz.ai使用方法

什么是Vocabulary AI？

如何使用 Vocabulary AI？

Vocabulary AI 的核心功能

Vocabulary AI 的使用案例

NineF AI平台 产品介绍

什么是SubtitlesDog？

如何使用 SubtitlesDog？

SubtitlesDog 的核心功能

SubtitlesDog 的使用案例

NineF AI平台产品介绍