Vidi2:字节跳动开源的多模态视频理解与生成模型
Vidi2是字节跳动智能创作与编辑团队研发的开源大型多模态视频理解与生成模型,作为初代Vidi的迭代升级版本,新增细粒度时空定位(STG)和视频问答(Video QA)核心能力,可...
Vidi2是字节跳动智能创作与编辑团队研发的开源大型多模态视频理解与生成模型,作为初代Vidi的迭代升级版本,新增细粒度时空定位(STG)和视频问答(Video QA)核心能力,可...
近日,字节跳动旗下AI编程工具TRAE宣布其核心创新功能SOLO模式正式登陆中国版平台,即日起对所有用户全量开放且完全免费使用。这一战略升级标志着TRAE从传统“代码生成”工...
SAIL-Embedding是字节跳动在Hugging Face平台开源的全模态嵌入基础模型,该模型突破传统单模态嵌入的局限,可将文本、图像等多类型数据映射至统一向量空间,实现跨模态特征...
近日,字节跳动在Hugging Face平台正式开源了FaceCLIP——一款专注于人脸理解与生成的视觉-语言模型。该工具通过文本提示与参考图像结合,可生成身份特征高度保留且表情、姿...