2023 12月 25 By astrill怎么续费 0 comment

苹果(Apple Inc)近日被发现在今年 10 月就与康乃尔大学共同悄悄发布了一个开源多模态大型语言模型 (MLLM)Ferret,一扫过去「苹果在 AI 竞赛中掉队」的形象。

据了解,苹果的 Ferret 模型仅供研究用途,并无商业许可,也没有任何宣传和公告,不过本周六,AI 医学非营利组织  Bart De Witte 在社群平台 X 发布了关於他「错过苹果的 LLM」这一消息之後,Ferret 模型才在 AI 社群中受到了广泛的关注,并且被认为尽管不能商业化,但 Ferret 极有可能在未来的苹果产品或服务中发挥影响力。另一个重要的讯息则是:苹果在 AI 领域其实更加开源了,没有保持一贯的神秘作风。

Apple AI /ML 研究科学家 Zhe Gan在 10 月的一条推文中解释了 Ferret 的用途,该系统可以以任何形状引用影像区域,且比 GPT-4V 对小影像区域表现出更好的精确理解力。简单来说,该模型可以查看图像上绘制的区域,确定其中对使用者在查询中有用的元素、辨识它,并在辨识到的元素周围绘制边界。然後,它可以使用该元素作为查询的一部分,并以典型的方式对其进行回应。

例如,使用者可以问动物图像中的某个动物图像(内含多种动物)中某个被突出显示的动物是什麽,它可以确定生物的物种以及使用者指的是群体中的单一动物。然後,它可以使用图像中检测到的其他项目的上下文来提供进一步的回应。

除此之外,前几日苹果才释出了一篇论文,介绍可创造虚拟分身的生成式 AI …