Intern-S1:上海AI实验室开源的多模态科学领域开源大模型
Intern-S1是上海AI实验室研发并开源的通专融合多模态科学推理大模型,是面向全球科研工作者、开发者与教育机构打造的通用科学AI基础平台,核心定位是解决科学研究中多模态数...
Intern-S1是上海AI实验室研发并开源的通专融合多模态科学推理大模型,是面向全球科研工作者、开发者与教育机构打造的通用科学AI基础平台,核心定位是解决科学研究中多模态数...
手把手完成 Claude Skills 本地安装与配置;深度解析 PDF/DOCX/Frontend Design 等 16 个官方内置技能触发逻辑、使用场景与避坑指南;含可运行前端页面生成实战及自定义 Sk...
GLM-OCR是智谱AI开源的轻量级多模态文档OCR模型,核心定位是小参数、高精度、易部署、全场景覆盖的专业级文档理解与文字提取工具。它基于GLM-V视觉-语言编码器-解码器架构构...
Happy Coder是一款完全开源、无遥测、无用户行为追踪的跨端配套工具,核心服务对象是使用Claude Code与Codex的开发者,其核心定位是作为AI编程代理的跨设备控制终端,打破桌...
TTT - Discover是由斯坦福大学和英伟达研究团队联合提出的测试时训练框架,其核心创新在于突破传统AI推理阶段冻结模型参数的局限,在测试阶段针对单个具体问题通过强化学习...
HoloCine是由香港科技大学、蚂蚁集团等机构联合推出的开源文本到视频(T2V)项目,该项目以整体生成为核心理念,通过窗口交叉注意、稀疏镜头间自注意两大核心机制,实现电影...
vLLM是一款高性能开源大语言模型(LLM)推理与服务库,核心依托PagedAttention分页注意力机制、连续批处理等技术创新,解决传统LLM推理中显存利用率低、延迟高、吞吐量低的...
Calligrapher是蚂蚁×港科大推出的基于扩散模型的书法风格化AI工具,支持英文文本定制、多参考模式与字符级笔画控制。本文提供Ubuntu+PyTorch2.5+CUDA12.1完整部署教程,详...
HeartMuLa 是一套开源的多语言音乐基础模型项目,核心目标是构建全链路的音乐生成与音视频文本处理能力,为开发者、研究者和普通用户提供开箱即用的音乐 AI 工具集。它是首...
AgentCPM-Report是一款聚焦于深度研究报告生成的开源大语言模型代理(LLM Agent),由清华大学自然语言处理实验室(THUNLP)、中国人民大学RUCBM实验室与ModelBest联合研发...
