Supertonic:开源的超高速设备端文本转语音工具
Supertonic是一款开源的文本转语音(TTS)系统,由韩国科技公司Supertone Inc.研发并开源,核心目标是解决传统TTS系统“依赖云服务、延迟高、隐私风险、资源占用大”等痛点...
Supertonic是一款开源的文本转语音(TTS)系统,由韩国科技公司Supertone Inc.研发并开源,核心目标是解决传统TTS系统“依赖云服务、延迟高、隐私风险、资源占用大”等痛点...
seekdb是由OceanBase团队开发的开源AI原生搜索数据库,它打破了传统数据库对数据类型的割裂限制,在单一引擎中实现了关系型数据、向量数据、文本数据、JSON数据及GIS地理空...
Bee是由清华大学与腾讯混元团队联合研发的全开源多模态大语言模型(MLLMs)全栈解决方案,项目通过三大核心产出——1500万条双级思维链(CoT)增强的高质量SFT数据集Honey-...
模型量化(Model Quantization)的本质是将神经网络中连续的浮点数值转换为离散的整数表示,通过降低数值精度实现模型压缩与加速。以FP32到INT8的转换为例,每个权重参数的...
Astron Agent是科大讯飞开源的企业级、商业友好型智能工作流开发平台,集成AI工作流编排、模型管理、智能RPA自动化、工具生态集成与团队协作能力。可帮助企业快速构建可扩展...
AI-Gamble是一个开源的AI动态互动小说游戏生成器,核心依托大型语言模型(LLM)的强大生成能力,为用户打造“选择决定剧情”的沉浸式阅读体验。简单来说,它不是传统的固定...
MagicAnimate是由新加坡国立大学和字节跳动团队开发的一个基于扩散模型的开源人体图像动画生成框架。简单来说,它的核心功能是:输入一张包含人体的参考图像和一个表示动作...
在人工智能技术深度渗透各领域的今天,AI提示词(Prompt)已成为连接人类需求与AI模型输出的关键桥梁。本文AI铺子精选8款经过验证的AI提示词生成工具,从功能定位、操作逻辑...
Kimi-K2是由Moonshot AI开发的开源代理智能模型,基于混合专家(MoE)架构,总参数达1万亿,激活参数320亿,在15.5万亿token上训练而成。该模型专注于工具使用、复杂推理和...
Step-Audio-EditX是阶跃星辰推出的一款开源音频编辑工具,基于 30 亿参数的大语言模型(LLM)构建,专注于提供富有表现力和迭代式的音频编辑体验。该工具不仅支持普通话、英...
