FLUX:Black Forest Labs 推出的开源多模态图像生成与编辑工具
FLUX是由Black Forest Labs开发的开源图像生成与编辑模型系列,涵盖文本驱动图像生成、图像填充、结构控制等多元功能。该项目通过模块化设计提供高效推理代码,支持开发者与...
FLUX是由Black Forest Labs开发的开源图像生成与编辑模型系列,涵盖文本驱动图像生成、图像填充、结构控制等多元功能。该项目通过模块化设计提供高效推理代码,支持开发者与...
Hunyuan-MT是腾讯开源的高性能多语言翻译项目,包含Hunyuan-MT-7B基础模型与Hunyuan-MT-Chimera-7B集成模型,支持33种语言互译(含5种中国少数民族语言)。项目提供完整的训...
Qianfan-VL是百度智能云千帆推出的开源领域增强多模态理解模型系列,涵盖3B、8B、70B三种参数规模,专注于企业级应用场景。该模型系列在保持通用能力的同时,特别强化了文档...
Presentation-AI是一款开源的AI驱动PPT生成工具,旨在帮助用户摆脱传统PPT制作的繁琐流程——无需专业设计能力,只需输入主题、数量等基础信息,AI即可自动生成完整大纲、内...
Fooocus是一款基于Stable Diffusion XL架构的离线开源免费图片生成软件,通过Gradio构建交互界面,以简化操作为设计理念,让用户无需复杂参数调整即可专注于提示词和图片生...
TrafficVLM 是一个专注于交通场景的可控视觉语言模型,主要用于交通视频的字幕生成任务。该模型融合了多粒度视觉特征(全局、子全局、局部)与时间编码机制,能够精准理解交...
SpikingBrain-7B是一个受大脑神经机制启发的大型语言模型项目,该项目的核心目标是通过创新的架构设计和技术整合,解决传统大语言模型在计算效率、能耗和长序列处理方面的局...
Stable Diffusion WebUI 是一款针对 Stable Diffusion 模型开发的开源可视化工具,核心目标是 “降低 AI 图像创作门槛”。它通过 Gradio 构建的友好网页界面,将原生 Stabl...
Deep Chat 是一个开源的 AI 聊天组件,旨在为开发者提供高度可定制、功能丰富的聊天界面解决方案。该组件支持文本、语音、文件等多模态交互,可轻松集成 OpenAI、HuggingFa...
OM1是由OpenMind开源的一个模块化的AI运行时系统,专为开发者打造,用于创建和部署能够跨数字环境和物理机器人工作的多模态AI代理。它采用Python设计,具有高度的灵活性和可...