Hojo-ASR:开源轻量语音识别模型,支持多语种离线极速转写
Hojo-ASR 是由 HojoAI团队开源的新一代自动语音识别(ASR)项目,该项目主打小参数量、高识别精度、极速推理、多语种兼容四大核心优势,同时兼顾云端服务器、本地PC、边缘设...
Hojo-ASR 是由 HojoAI团队开源的新一代自动语音识别(ASR)项目,该项目主打小参数量、高识别精度、极速推理、多语种兼容四大核心优势,同时兼顾云端服务器、本地PC、边缘设...
音刻(Inkr)一款音视频转录工具,支持实时会议录音、主流音视频文件和链接。能快速转录并一键总结内容,支持100多种语言,转录快,精准度高,适用于长时会议记录、内容创作、...
NovaVoice是一款专为桌面端设计的AI语音操作系统(Voice OS),核心以200+WPM极速听写、智能文本重构、跨应用语音控制、上下文感知助手四大功能为核心,实现“动口不动手”...
MAI-Transcribe-1是微软公司发布的自研旗舰级语音转文字(Speech-to-Text,STT)AI模型,隶属于微软MAI系列自研AI模型矩阵(同期发布MAI-Voice-1语音生成、MAI-Image-2文生...
麦耳会记是思必驰科技股份有限公司推出的一款集实时语音转文字、同传翻译、AI摘要与辅助写作为一体的智能会议办公助手。其通过先进的全链路智能语音语言技术,实现从语音采...
讯飞同传是科大讯飞旗下的一款专业AI同声传译与实时字幕翻译软件及服务平台。它基于科大讯飞全球领先的智能语音识别、机器翻译和语音合成技术,旨在为用户提供跨语言、跨场...
SaySo是世界上首个为场景优化的AI语音助手,专为追求极致效率的Mac与Windows用户设计。它不仅仅是一个传统的语音转文字工具,更是一个能够深度理解语境、意图,并将随性口语...
Emra Voice是一款“始终在线语音工具包”,以“将想法从脑中快速转化为文字”为核心使命的桌面语音工具。它通过先进语音识别技术,帮助用户高效完成“语音→文本”的无损转...
Notta AI 是一款基于人工智能技术开发的智能会议记录与语音转文字工具,致力于为用户提供高效、精准的会议内容管理解决方案。它通过先进的语音识别与自然语言处理技术,能够...
TurboScribe 是一款由人工智能(AI)驱动的在线语音与视频转文字服务,致力于为用户提供高效、精准、安全的音频/视频内容文本化解决方案。它利用先进的自然语言处理(NLP)...
Omnilingual ASR是由Meta(Facebook Research)开源的多语言语音识别系统,支持全球超过1600种语言(含数百种稀有语言),提供从300M到7B的多规格模型,支持零样本学习与无...
YakGPT是一个基于Web技术开发的开源ChatGPT UI工具,其核心定位是“简单、本地运行、高效交互”的智能聊天平台。与官方ChatGPT界面不同,YakGPT无需用户下载安装独立应用,...
Any2Text 是一款基于先进人工智能技术开发的完全免费、无需注册的在线音频与视频转文字工具。它利用强大的AI语音识别引擎,能够将用户上传的音频或视频文件快速、准确地转换...
Transcriptly是一款基于人工智能技术开发的在线音视频转文字(Audio & Video to Text)工具平台,无论是YouTube上的教学视频、播客节目、新闻采访,还是本地存储的MP3音频或...
AI Video Transcriber是一款开源的人工智能视频处理工具,专注于将视频中的语音内容精准转换为文本,并能基于转录内容生成多语言智能摘要。该工具整合了当前先进的语音识别...