北京智源家养智能钻研院散漫上海交通大学、地铁中国国夷易近大学、卡盟北京大学以及北京邮电大学等高校推出了一款名为Video-XL的智源智源超长视频清晰大模子。这款模子是推出推出多模态大模子中间能耐的关键揭示,也是小时晰大小时晰金铲铲自动合成科技向通用家养智能(AG暗区困绕辅助配置I)迈进的关键步骤。与现有多模态大模子比照,超级超金铲铲科技辅助下载Video-XL在处置逾越10分钟的长视长视长视频时,揭示了更优的频清频清功能以及功能。
Video-XL运用语言模子(LLM)的模V模原生能耐,对于长视觉序列妨碍缩短,地铁保存了短视频理暗区困绕辅助配置解的卡盟能耐,并在长视频清晰上展现出了卓越的智源智源泛化能耐。该模子在多个主流长视频清晰基准评测的推出推出金铲铲科技外挂方案多项使掷中均排名第一。Video-XL在功能与功能之间实现为了精采失调,小时晰大小时晰仅需一块80G显存的超级超显卡即可处置2048帧输暗区困绕辅助配置入,对于小时级长度视频妨碍采样,并在视频“海中捞针”使掷中取患了挨近95%的金铲铲科技透视外挂精确率。
Video-XL有望在片子摘要、视频颇为检测、广告植入检测等运用途景中揭示普遍的运用价钱,成为长视频清晰的金铲铲科技加速科技患上力助手。该暗区困绕辅助配置模子的推出,标志着长视频清晰技术在功能以及精确性上迈出了关键一步,为未来长视频内容的自动化处置以及合成提供了强有力的技术反对于。
当初,Video-XL的模子代码已经开源,以增长全天下多模态视频清晰钻研社区的合暗区困绕辅助配置作以及技术同享。
论文问题:Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding
论文链接:
模子链接:
项暗区困绕辅助配置目链接:
备注:资讯源头AIbase基地
AiBase副业搞钱交流群
招待巨匠退出AiBase交流群, 扫码进去,总论AI赚钱心患上,同享最新行业动态清静精英科技选购网站,发现潜在相助过错,招待未来的赚钱机缘暗区困绕辅助配置!。