字节跳动发布FaceCLIP:多模态AI人脸生成技术实现身份一致性新突破
近日,字节跳动在Hugging Face平台正式开源了FaceCLIP——一款专注于人脸理解与生成的视觉-语言模型。该工具通过文本提示与参考图像结合,可生成身份特征高度保留且表情、姿...
近日,字节跳动在Hugging Face平台正式开源了FaceCLIP——一款专注于人脸理解与生成的视觉-语言模型。该工具通过文本提示与参考图像结合,可生成身份特征高度保留且表情、姿...
Youtu-Embedding是腾讯优图实验室开发的业界领先通用文本表示模型,开源于GitHub平台。该模型通过“LLM预训练→弱监督对齐→协同-判别式微调”三阶段创新流程,在权威中文文...
近日,谷歌正式推出Nano Banana图像编辑功能,并在其Gemini应用中收获了良好反响。这一功能现已集成至AI模式和Google Lens,为用户提供更便捷的图像编辑与生成服务。根据...
在人工智能浪潮席卷全球的当下,AI芯片市场的竞争已进入白热化阶段,英伟达长期占据着主导地位。然而,科技巨头甲骨文(Oracle)近期宣布的一系列重大举措,犹如一颗重磅炸...
2025 年 10 月 13 日,微软 AI(Microsoft AI)正式对外发布旗下首款完全自研的图像生成模型 ——MAI-Image-1。该模型首次亮相便凭借出色性能跻身 LMArena 平台文本到图像模型...
Paper2Video是新加坡国立大学Show Lab开发的开源学术工具,通过PaperTalker智能代理,以LaTeX论文源码、参考肖像图及10秒参考音频为输入,自动生成包含结构化幻灯片、时间对...
中国领先的多模态AI创作社区LiblibAI近日宣布推出革命性版本LiblibAI2.0,标志着其从单一工具平台向覆盖创作全链条的生态化系统转型。此次升级以"专业级创作+零门槛体验"为...
近日,开源全能AI对话助手[Cherry Studio]正式推出v1.6.4版本,并首次集成自主研发的CherryIN智能聚合系统。该系统凭借对主流AI模型的深度整合与优化,成为全球首个支持多模...
UserLM-8b是微软研究院开发的开源用户模拟大模型,其核心目标是填补“用户角色模拟”的LLM空白——常规LLM以“助手”身份生成帮助性响应,而UserLM-8b专为模拟“用户”在对...
