超越GPT-4V,苹果Ferret-UI引领智能新纪元!
4月11日消息,苹果公司于4月8日发布了一款名为Ferret-UI的新型多模态大语言模型,该模型能够有效理解和与屏幕信息进行交互,并在所有基本UI任务上超越了GPT-4V。这一技术的发布,让人们对未来智能交互的期待愈发高涨。
据本站了解,Ferret-UI被设计为一种专为理解移动UI屏幕量身定制的MLLM,它具备指向、定位和推理等多重能力。该技术通过灵活的输入格式和基础任务,能够在移动用户界面屏幕上执行各类引用任务。Ferret-UI的一个显著特点是任何分辨率技术,这项技术通过放大细节来解决UI屏幕中小型对象的识别问题,进而提升模型对UI元素的理解精度。
网友对此技术表示出极大的热情,纷纷称赞其泰裤辣。尽管苹果的泰坦项目曾遭遇挫折,但Ferret-UI的发布无疑为苹果在AI领域注入了新的活力。人们期待,如果这项技术能够应用于Siri,那么未来的智能助手将会变得更为聪明和便捷。
此外,研究人员为了增强模型的推理能力,特别编译了用于高级任务的数据集,包括详细描述、感知/交互对话和功能推理。在基础任务性能的比较上,Ferret-UI展现了对UI屏幕的出色理解能力以及执行开放式指令的能力。
随着技术的不断进步,掌握应用程序屏幕并使AI像人类一样进行交互,苹果未来或将改变MLLM的游戏规则,为我们带来更加智能和便捷的生活体验。
相关文章
- 苹果放大招!新模型Ferret-UI将颠覆AI交互?
- 爆料!苹果新款iPad或将静默上线,不举办发布会?!
- 苹果新款iPhone SE 4预计明年登场,规格功能全揭秘
- 台积电2nm工艺取得突破,iPhone 17 Pro将率先采用
- 苹果iOS 17.5 Beta 1更新亮点:Apple News+新增‘Quartiles’文字游戏
- iOS 18或将推出全新Safari浏览助手,智能概述网页内容
- 台积电新工艺曝光:2纳米技术2025年量产,苹果iPhone 17有望首搭
- 苹果春季无活动,新品通过新闻稿揭晓
- 全新显示屏技术助力Apple Watch Series 10,功耗更低续航更久
- 苹果大动作!iPhone 16或新增拍照键,为何这么设计?
- 苹果严控Vision Pro隐私:创新受限,开发者有话说
- 苹果预计年底前推新iPad mini和入门级iPad
- 苹果iPhone在中国市场遭遇挑战,华为等本土品牌崛起
- iPad Pro 2024预计5月亮相:苹果史上最强平板来袭
- 新款iPhone SE大曝光,彻底颠覆你的想象!
- 苹果Apple Vision Pro将推出Beta版空间角色功能
热门教程
Win11每次开机会检查tpm吗?Win11每次开机是否会检查tpm详情介绍
2Win11任务栏空白怎么办?Win11任务栏空白解决办法
3Win10 21H1更新KB5003637后任务栏不能在底部显示怎么办?
4Win10家庭版笔记本电脑怎么关闭Windows defender功能?
5系统之家装机大师怎么用?系统之家装机大师使用教程
6Win11正式版怎么安装安卓APK应用?Win11安装安卓APK文件方法
7Win11资源管理器的样式如何切换?Win11资源管理器样式切换方法
8Win11电脑下载的文件被自动删除怎么办?
9Win11蓝屏怎么修复?win11蓝屏修复教程
10老电脑怎么装win11系统?老电脑一键升级Win11系统教程
装机必备 更多+
重装教程
大家都在看
电脑教程专题 更多+