GPT-4在抽象推理上差距显著：AGI发展之路依然崎岖

偌岸丶 • 2024年1月2日 14:30:00 • 新闻 • 258 views

随着科技的不断进步，GPT-4作为目前最强大的通用语言模型，尽管在多项任务上表现出色，但在抽象推理方面与人类水平存在较大差距。圣达菲研究所的最新研究揭示了这一差距，挑战了GPT-4作为通用人工智能（AGI）的未来发展。

近期，圣达菲研究所的科研人员通过严谨的定量研究方法发现，GPT-4在推理和抽象方面与人类水平存在较大差距。尽管GPT-4被认为是目前最强大的通用语言模型，但要实现从其水平发展出AGI，似乎还有相当长的一段路要走。

GPT-4引起了广泛的关注，一些人对其是否具备AGI的特征提出了质疑。其中，主要反对意见集中在GPT-4的有限推理能力和任务特定的泛化上。

首先，GPT-4被指责不能执行“反向推理”，并且在对世界的抽象模型进行估计方面面临困难。此外，虽然GPT-4在形式上可以进行泛化，但在跨任务的目标方面可能会遇到困难。

为了更具体地评估GPT-4在抽象推理能力方面的表现，研究人员采用了ConceptARC基准测试。这一测试基于ARC（一组手动创建的类比谜题）的基础上进行了改进，旨在更加系统性地对比人类和GPT-4在抽象推理方面的能力。

ConceptARC测试以480个任务为基础，这些任务涵盖了特定核心空间和语义概念的系统变化，如Top和Bottom、Inside和Outside、Center，以及Same和Different。每个任务以不同的方式实例化这些概念，并具有不同程度的抽象性。

结果显示，纯文本版本的GPT-4在480个任务上的表现远远不如人类。对于多模态的GPT-4V，在最简单的48个任务的视觉版本上，其性能甚至低于纯文本情况。

尽管GPT-4被广泛认为是目前最强大的通用语言模型，但这项研究表明，它仍然无法稳健地形成抽象并推理关于基本核心概念的内容，尤其是这些概念在其训练数据中之前未见过的上下文中。

对于GPT-4和GPT-4V在抽象推理能力上的提升，研究人员表示可能需要通过其他提示或任务表示方法来实现。这一研究的结果引发了对大型语言模型是否能够完全达到人类水平的深刻思考，显示出在实现AGI方面，我们仍然面临着巨大的挑战和未知。

Expand and read the remaining 63%

本文来自投稿，不代表TePhone特锋手机网立场，如若转载，请注明出处：https://www.tephone.com/article/3113

AGI GPT-4

Like (0)

偌岸丶编辑

0 0

苹果高管：连续互通功能，苹果生态的核心组成部分

Previous 2024年1月2日 14:00:00

苹果2023年首度“停更”iPad：为重新定位做准备

Next 2024年1月2日 15:00:00

新闻

微软市值超越苹果，纳德拉：不应过度关注股价

在最近的达沃斯举行的一次采访中，微软CEO萨蒂亚・纳德拉（Satya Nadella）谈到了公司与OpenAI的合作关系，并强调了稳定性、一致性和良好治理的重要性。纳德拉对Open…

Android
2024年1月17日
30000
新闻

谷歌或将考虑为Assistant with Bard重新命名为Gemini

最新的谷歌应用测试版（版本15.4.31.29）中，之前提到“Bard”（之前称为Assistant with Bard）的所有字符串和用户界面现在都改为了“Gemini”。 As…

cl15
2024年1月31日
37700
新闻

苹果可能在WWDC发布AI应用商店的大新闻

苹果的WWDC主题演讲将在六月举行，预计将非常令人兴奋。据报道，苹果正在致力于有史以来最大的iOS更新，iOS 18将包括苹果的新人工智能（AI）计划，其中一些将基于云端运行，而一…

Apple
2024年3月27日
31600
新闻

如何在iPhone和Android手机应用中添加字幕

手机字幕功能已经成为当今数字领域的常见功能，使内容更加易于访问。无论是社交媒体中的视频，还是电视节目，都可以看到字幕的身影。苹果和安卓设备都内置了类似于电视上的字幕功能，可以将手机…

玩机客
2024年3月15日
96300
新闻

Spotify不再支持苹果iPhone应用内购，应对欧盟《数字市场法》

近期，Spotify宣布放弃在苹果iPhone应用内提供订阅服务的计划，这一决定是对欧盟对苹果处以重罚后的回应。今年早些时候，Spotify曾计划推出一个特殊版本的iPhone应用…

binbin
2024年3月6日
32800
安卓

国人点赞！华为HUAWEI FreeBubs Pro 3获得“最佳耳机”奖项

据外媒报道，国外知名科技新闻平台Frandroid对2023年全球的智能产品进行了盘点，其中在可穿戴设备上，评华为FreeBuds Pro 3获得了“最佳无线耳机”奖。据了解，华…

暴雨
2023年12月14日
30800
新闻

Google的Lumiere：AI视频技术逼近真实

Google最新发布的视频生成AI模型Lumiere采用了全新的扩散模型Space-Time-U-Net（STUNet），让人工智能视频制作更接近真实。该模型通过空间和时间的双重考…

Apple
2024年1月29日
48800
新闻

Fairphone推出Fairbuds耳机，支持ANC和可更换电池，售价149欧元

荷兰科技品牌Fairphone推出了Fairbuds耳机，这款耳机采用了许多可更换和可维修的部件，包括电池。许多品牌提供蓝牙耳机，但问题在于其中许多产品完全无法修复，很可能会成为…

Android
2024年4月11日
36900
新闻

三星Galaxy S24 Ultra手机登上30000米高空，拍摄地球壮丽照片

为展示其最新旗舰手机Galaxy S24 Ultra的出色拍照功能，三星公司近日采取了一项富有创意的举措，将四部手机送入高空，拍摄美国西部的壮丽景色。据悉，三星采用了特制的轻质碳…

聆听
2024年3月7日
42100
新闻

Orion全新登場：首款真實增強實境眼鏡，為數位時代開創新視野

五年前，我們向世界宣布將開發增強實境（AR）眼鏡，目的是希望人們不再必須在擁有數位世界的便利和現實生活的專注之間做出選擇。今天，我們正式推出Orion，這是我們認為目前最先進的AR…

Ai-i
2024年9月28日
41800
iPhone

iPhone如何安装软件怎么办？Apple苹果手机如果不能安装软件怎么办？

在我们的日常生活中，手机iPhone已经成为我们生活中不可或缺的一部分。而作为智能手机领域的佼佼者，Apple苹果手机一直备受瞩目。然而，在使用苹果手机的过程中，我们有时会遇到无法…

偌岸丶
2023年12月6日
43000
导购

Google Pixel 9 Pro Fold 经典手机壳推荐：8款值得关注的选择

Google Pixel 9 Pro Fold 已经发布，市场上也推出了首批适用于这款新折叠手机的手机壳。虽然目前的选择较为有限，但预计未来会有更多款式加入。以下是目前市面上几款最…

Tech News
2024年8月17日
75700
新闻

美国据称在禁令生效前数周停止向中国出口ASML芯片制造设备

尽管英伟达可能已经找到绕过美国对华出口限制的方法，但荷兰公司ASML，该公司是关键芯片制造设备的制造商，对此似乎束手无策。据彭博社报道，拜登政府在2024年1月1日出口禁令生效前“…

Tech News
2024年1月4日
36200
iPhone

如何在 iOS 18 中启用 RCS 信息

支持丰富通信服务（RCS）是 Apple iOS 18 更新中的一个鲜为人知的功能。RCS 是短信的增强版本，其实现将使 Apple 用户能够像与其他 Apple 用户通信一样与 …

Android
2024年8月7日
2.7K00
新闻

华为新专利揭示人体通信技术，无线耳机等可穿戴设备实现便捷信息传输

近日，国家知识产权局中国专利公布公告网站公布了华为技术有限公司申请的一项名为“基于人体通信的电子设备、通信装置和系统”的专利。该专利揭示了一种基于人体通信的电子设备，可通过无线耳机…

tp_admin
2024年1月24日
48500
新闻

如何连接iPhone或iPad到三星电视：AirPlay 2使用指南

将智能手机微小屏幕上的内容投影到大屏幕电视上，能够更好地欣赏照片和观看视频。你可以镜像手持设备屏幕上的任何内容。借助苹果的AirPlay系统，从iOS设备投放音频和视频变得更加流畅…

小雨
2024年2月5日
3.4K00
安卓

vivo预热新机S18 搭载5000mAh蓝海电池

据海外媒体报道，vivo官方预热了他们的新机vivo S18系列的海报信息，新机搭载5000mAh蓝海电池，并誉为是vivo S系列迄今为止续航最长的手机。 vivo官方表示，vi…

小雨
2023年12月12日
31400
新闻

光速打脸！马斯克接手X（原推特）后广告收入大幅度下滑

据外媒报道，马斯克自去年10月份接手X社交平台（原推特），从最初的削减内容审查、取消违规用户禁令，再到最近的“反犹”舆论风波，马斯克给X带来了不少风波，也导致这个平台的广告收入锐减…

暴雨
2023年12月13日
34100
安卓

三星Samsung Galaxy Tab Active4 Pro将在今年年底迎来Android 14更新

毫不奇怪，Galaxy Tab Active4 Pro将在今年年底迎来其第二次重大软件升级，即Android 14更新。最初在2022年推出时，Galaxy Tab Active4…

tp_admin
2023年12月31日
36900
安卓

vivo X200系列预告：新款远摄镜头支持10倍变焦

vivo即将于10月14日推出X200系列，预计将包括标准版和Pro版两款手机。今天，vivo公布了这款手机远摄镜头的首张样张，展示了比前代产品更亮的光圈。 vivo的一位产品经理…

Ai-i
2024年9月20日
64000

GPT-4在抽象推理上差距显著：AGI发展之路依然崎岖

相关推荐

發佈留言

Share To :