Auto_Ai_Subtitle:基于Whisper与FFmpeg的自动字幕生成与翻译工具
auto_ai_subtitle 是一个开源工具,旨在通过自动化流程为视频生成字幕并支持多语言翻译。项目基于 OpenAI Whisper 的语音识别能力和 FFmpeg 的音频处理技术,结合翻译API(...
auto_ai_subtitle 是一个开源工具,旨在通过自动化流程为视频生成字幕并支持多语言翻译。项目基于 OpenAI Whisper 的语音识别能力和 FFmpeg 的音频处理技术,结合翻译API(...
UltraRAG是由清华大学THUNLP团队、东北大学NEUIR实验室、OpenBMB及AI9star团队共同开发的开源检索增强生成(RAG)框架,旨在解决传统RAG系统构建复杂、工程实现成本高、知识库...
据招聘平台脉脉最新数据显示,截至2025年7月,人工智能相关岗位的招聘薪资下限均值已达4.7万元/月,较2024年初上涨14.16%;上限均值则攀升至7.8万元/月,同比涨幅达8.98%。...
Claude Context是一个基于Model Context Protocol(MCP)的开源插件,专为Claude Code及其他AI编码助手设计,旨在通过语义搜索技术为开发者提供全代码库的上下文支持。该项...
Agent-to-Agent (A2A)协议由Google于2025年4月正式发布,A2A通过定义智能体间的通信规则、能力发现机制和任务管理框架,首次实现了跨平台、跨供应商的智能体协作。本文AI铺...
AgentGateway 是一个开源的AI原生代理通信网关,由云原生应用网络公司Solo.io创建并捐赠给Linux基金会管理,旨在为现代AI代理生态系统提供安全、可观测且可扩展的连接解决方...
Vivid-VR 是阿里巴巴集团开源的一款生成式视频修复工具,基于先进的文本到视频(Text-to-Video, T2V)扩散Transformer架构,结合创新的"概念蒸馏"训练策略与智能控制架构,...
生成对抗网络(Generative Adversarial Networks,GAN)是深度学习领域最具革命性的创新之一,本文AI铺子将从数学原理、架构设计、训练机制及典型应用四个维度,系统解析GA...
对于许多非专业人士而言,AIGC和AI这两个概念常常容易混淆,甚至被误认为是同一事物。本文AI铺子将深入剖析AIGC的内涵,并详细阐述AIGC与AI的区别与联系,帮助读者准确理解...
9月1日起,由国家网信办、工信部、公安部、国家广电总局联合发布的《人工智能生成合成内容标识办法》将正式实施。要求所有通过人工智能技术生成的文本、图片、音频、视频及...
