AI 抠图工具有哪些?8 个 Github 热门开源 AI 抠图工具推荐
深度解析8款GitHub热门开源AI抠图工具(IOPaint, RMBG 2.0, MODNet, BiRefNet, RobustVideoMatting等),涵盖静态图像与视频流处理。提供详细的技术原理、Star数对比、选型...
深度解析8款GitHub热门开源AI抠图工具(IOPaint, RMBG 2.0, MODNet, BiRefNet, RobustVideoMatting等),涵盖静态图像与视频流处理。提供详细的技术原理、Star数对比、选型...
FramePack是一款开源的下一代帧预测视频扩散框架,通过固定长度上下文压缩与抗漂移采样技术,实现仅6GB显存即可生成1分钟以上高清长视频,支持图生视频、文生视频,兼顾训练...
NullClaw是一款完全采用Zig语言开发的自主AI助手基础设施,以极致轻量化、高性能、零开销、全平台可移植为核心设计目标,编译后仅678KB静态二进制,峰值内存约1MB,启动速度...
Ctrl-World 是由清华大学与斯坦福大学联合研发、基于 PyTorch 实现的可控生成式世界模型,专为机器人操控任务设计。它以 Stable Video Diffusion 为基座,通过动作条件驱动...
零代码微调大模型实战指南!详解 LLaMA-Factory 框架下 LoRA+SFT 全流程:数据集构建、YAML 配置、WebUI 训练、动态推理、BLEU/ROUGE 评估、模型合并导出、OpenAI 兼容 API...
Megatron-LM是NVIDIA开源的面向GPU深度优化的大模型训练模型,包含Megatron-LM训练框架与Megatron Core核心库两大组件,支持GPT、BERT、T5、MoE、Mamba、多模态等全品类模型...
近日,日本京都大学“人与社会未来研究院”熊谷诚慈教授团队正式发布了一款名为“佛机器人Plus”(Buddhabot Plus)的实体机器人,而其硬件基础正是中国宇树科技的G1人形机...
FireRedASR2S是小红书智能创作基础技术团队开源的SOTA级工业级一站式语音识别系统,集成FireRedASR2语音识别、FireRedVAD语音活动检测、FireRedLID语言识别、FireRedPunc标...
Monty是Pydantic团队推出的一款实验性、轻量级、安全沙箱化Python解释器,底层由Rust语言实现,核心定位是安全运行LLM生成的Python代码,专为AI Agent、自动化工具、动态代...
ClawWork是由香港大学数据科学实验室(HKUDS) 研发并开源的AI智能体经济生存与职业能力基准测试平台,核心定位是把传统AI助手从“辅助工具”升级为能完成真实专业工作、创...
