
发布日期:2025-01-24 17:50 点击次数:85
品玩1月24日讯,据 Hugging Face 页面显露,旗下最小多模态大模子SmolVLM-256M 近日发布,它不错继承轻易序列的图像和文本输入,从而产生文本输出。
据悉,贵金属投资SmolVLM-256M的野心旨在擢升后果。SmolVLM 不错回应干系图像的问题、样貌视觉骨子或转录文本。它的轻量级架构使其适用于诞生上的哄骗,同期在多模态任务中保执强盛的性能。只需不到 1GB 的 GPU 内存,它就能在一幅图像上进行推理。
需要留心的是,该模子不扶持图像生成。