Lance:字节开源3B统一多模态模型,图文视频生成编辑一站式实现
Lance是由字节跳动正式开源发布的轻量化统一原生多模态大模型,整体参数量仅3B,依托自研Transformer主干架构完成全链路从零训练,摒弃传统多模态模型拆分式设计思路,真正...
Lance是由字节跳动正式开源发布的轻量化统一原生多模态大模型,整体参数量仅3B,依托自研Transformer主干架构完成全链路从零训练,摒弃传统多模态模型拆分式设计思路,真正...
火山引擎是字节跳动旗下AI云原生全栈服务平台,核心定位是将字节跳动内部经50+业务场景验证的技术能力、增长方法与应用工具,全面开放给外部企业与开发者。平台以GPU算力为...
UI-TARS-desktop是字节跳动开源的多模态AI智能体桌面应用项目,基于UI-TARS模型构建,集成Agent TARS通用多模态AI智能体栈,提供本地/远程计算机、浏览器GUI智能操作能力,...
Vidi2是字节跳动智能创作与编辑团队研发的开源大型多模态视频理解与生成模型,作为初代Vidi的迭代升级版本,新增细粒度时空定位(STG)和视频问答(Video QA)核心能力,可...
近日,字节跳动旗下AI编程工具TRAE宣布其核心创新功能SOLO模式正式登陆中国版平台,即日起对所有用户全量开放且完全免费使用。这一战略升级标志着TRAE从传统“代码生成”工...
SAIL-Embedding是字节跳动在Hugging Face平台开源的全模态嵌入基础模型,该模型突破传统单模态嵌入的局限,可将文本、图像等多类型数据映射至统一向量空间,实现跨模态特征...
近日,字节跳动在Hugging Face平台正式开源了FaceCLIP——一款专注于人脸理解与生成的视觉-语言模型。该工具通过文本提示与参考图像结合,可生成身份特征高度保留且表情、姿...