browser-use:AI 驱动的浏览器自动化控制框架,实现网页自动化与数据交互
browser-use 是一个创新的开源项目,它将大型语言模型 (LLM) 与浏览器自动化技术相结合,实现了通过自然语言指令控制浏览器的功能。该项目使用 Playwright 作为浏览器自动化...
browser-use 是一个创新的开源项目,它将大型语言模型 (LLM) 与浏览器自动化技术相结合,实现了通过自然语言指令控制浏览器的功能。该项目使用 Playwright 作为浏览器自动化...
Deep Lake 是一款专为 AI 设计的开源数据库,基于优化的存储格式,适用于深度学习应用。它支持存储和搜索多模态数据及向量,能简化 LLM 应用部署与深度学习模型训练的数据集...
DeepSeek-V3.2-Exp是DeepSeek-AI推出的实验性大模型版本,作为下一代架构的中间迭代产物,其核心基于DeepSeek-V3.1-Terminus升级,创新引入DeepSeek Sparse Attention(DSA...
MoneyPrinterTurbo 是一款开源的全自动 AI 短视频生成工具,旨在让用户无需专业技能即可快速制作高质量短视频。只需输入主题或关键词,系统就能自动完成文案撰写、素材匹配...
Lynx是字节跳动Intelligent Creation团队开发的开源高保真个性化视频生成模型,基于Diffusion Transformer(DiT)架构,通过ID-adapter(身份保留)和Ref-adapter(空间细节...
OpenPPT是必优科技基于ChatPPT核心服务开源的Web端在线AI PPT生成创作工具,覆盖PPT从“新建/导入”“编辑”“美化排版”“播放”“演讲”到“导出下载”的全流程服务。其支...
xLLM 是京东开源的一款高性能大语言模型推理框架,专为国产 AI 加速器优化,采用服务 - 引擎解耦架构,实现高效的企业级部署。该框架通过全图流水线执行、动态形状图优化、...
JoySafety 是京东正式开源的企业级大模型安全防护框架,旨在解决生成式人工智能应用落地过程中的各类安全风险。该框架在京东内部已广泛应用于多个业务场景,包括 AI 导购、...
Dolphin是字节跳动推出的一款多模态文档图像解析框架,采用"分析-解析"两阶段范式,通过异构锚点提示技术实现高精度文档理解。该框架能够有效识别和解析文档中的文本段落、...
Qwen3-ASR-Toolkit是一个专为Qwen-ASR API设计的高性能Python命令行工具包。它通过智能音频分割和并行处理,突破了API的3分钟时长限制,支持超长音频和视频的高效转录。该工...