YouTuber使用OpenAI的GPT-4重新制作“伪造”的Google Gemini视频

cl15 • 2023年12月13日 14:35:00 • 新闻 • 335 views

一位YouTuber利用OpenAI的视觉AI模型GPT-4V重新制作了Google Gemini Ultra视频，该视频展示了对实时视频变化的即时响应。谷歌上周推出了令人印象深刻的Gemini人工智能模型，包括旗舰Gemini Ultra，其中的视频似乎显示它实时响应视频中的变化，但问题是，谷歌是在伪造。

YouTuber使用OpenAI的GPT-4重新制作“伪造”的Google Gemini视频

Google发布的宣传视频实际上是Gemini Ultra在更长的时间内通过静止图像解决问题，而不是实时响应。为了验证是否可能让AI执行类似的任务，比如在视频中找到球、在地图上识别位置或者在绘制图像时发现变化，Greg Technology创建了一个简单的应用程序来测试GPT-4V对相同概念的处理能力。

Gemini Ultra从头开始就被训练成为多模态模型。这意味着其数据集包括图像、文本、代码、视频、音频甚至动作数据，使其能够更广泛地理解世界并以“人类的方式”看待。

为了展示这些功能，谷歌发布了一个视频，展示了不同的操作，Gemini的声音描述了它能看到的内容。在视频中，这一切似乎是实时发生的，Gemini对变化作出响应，但实际情况并非如此。尽管响应是真实的，但它们是静止图像或片段，而不是实时的。简而言之，该视频更像是一次营销活动，而不是技术演示。

在一个短短的两分钟视频中，Greg，这位为他的频道制作新技术演示的人，解释说他对Gemini的演示感到兴奋，但发现它并非实时，令他感到失望。“当我看到这一点时，我觉得有点奇怪，因为一个月前发布的GPT-4 vision一直在做演示中展示的事情，只不过是实时的，”他说。

与ChatGPT Voice版本类似，与之类似的自然语气进行回答。区别在于这包括了视频，并使OpenAI模型对手势作出响应，识别水上鸭的绘画，并玩剪刀石头布。

由Greg Technology制作的用于演示视频的ChatGPT Video接口的代码已在GitHub上发布，以便其他人也可以尝试使用。

尝试使用GPT-4 Vision代码

我在我的Apple MacBook Air M2上安装了Greg Technology制作的代码，并将其与我的GPT-4V API密钥配对，以查看这个视频是否有效，而不是另一个“伪造演示”。几分钟后，我已经安装并运行它，效果完美。它愉快地识别手势、我的玻璃咖啡杯和一本书。它甚至可以告诉我书的标题和作者是什么。

这显示了OpenAI在多模态支持方面有多么领先，特别是在其他模型现在能够分析图像内容的同时，它们在实时视频分析方面可能会遇到困难。

Expand and read the remaining 31%

本文来自投稿，不代表TePhone特锋手机网立场，如若转载，请注明出处：https://www.tephone.com/article/840

Like (0)

cl15编辑

0 0

德国亚马逊火爆促销中！真我realme 11 Pro+抢购价399.99欧元，享受23%优惠！

Previous 2023年12月13日 14:11:15

德国亚马逊特惠！真我Realme 10 128GB 8GB 手机，享受36%的折扣，仅售179.99欧元！

Next 2023年12月13日 14:54:25

新闻

数千部手机和路由器被带入代理服务，用户毫不知情

近日发布的两份不相关报告显示，黑客正在利用数千个用户的设备，匿名化其非法的在线活动。安全公司Lumen Labs的一份报告称，大约有40,000台家庭和办公室路由器被纳入了一项犯…

Apple
2024年3月28日
39700
新闻

iPhone SE 4迎来重大升级：告别LCD，拥抱OLED时代

苹果可能会在2025年推出配备OLED显示屏的iPhone SE 4，这一举措将使SE系列与苹果更高端的iPhone机型在显示技术上保持一致。

数码最前线
2024年2月18日
42200
iPhone

Apple Intelligence、iPhone Mirroring to Mac 和 SharePlay Screen Sharing 在欧盟推出时将无法使用

苹果公司周五宣布，当 iOS 18 和 macOS Sequoia 于今年秋季晚些时候发售时，其即将推出的操作系统的三大功能将不会在欧盟提供。据彭博社报道，Apple Intel…

暴雨
2024年6月24日
72900
新闻

京东官宣将于12月31日公布与特斯拉新消息

近日，京东和特斯拉共同宣布，将于12月31日联合发布新消息。今年2月，特斯拉在京东官方旗舰店正式上线，但目前仅出售充电桩、挡泥板、遮阳帘等周边配件以及雨伞、水杯等周边商品，并未涉及…

cl15
2023年12月26日
28400
安卓

折叠手机真正登场，2024年将是折叠手机的大年份

在Galaxy Z Flip 5这款手机上，1.9英寸屏幕和3.4英寸屏幕之间的差异听起来并不大，但实际上在外部屏幕上却产生了很大的影响。今年，Flip 5的外部屏幕变得更大、更实…

cl15
2023年12月21日
34400
新闻

苹果面临的大型诉讼：为何被起诉以及对iPhone的影响解析

在美国司法部（DOJ）的诉讼下，苹果公司正面临着来自整个科技行业的冲击。这场诉讼指控苹果在iPhone周围不公平且非法地构建了垄断地位。让我们来解析一下为何苹果会被起诉以及这对iP…

Tech News
2024年3月26日
42500
安卓

Pixel用户呼吁恢复无限制Google照片存储，让摄影更自由

当人们问我为什么要购买Pixel手机时，我通常会总结说，它的相机是市场上最好的之一。那么，与可能是Android市场上最佳相机系统完美搭配的是什么呢？那就是为您所有精彩的照片提供免…

tp_admin
2023年12月23日
66100
新闻

SpaceX计划2月启动第三次Starship星舰飞行测试

SpaceX的Starship星舰在2023年进行了两次试飞，但都以失败告终。现在，该公司表示第三次试飞最早可能在下个月进行。在周二的NASA电话会议上，SpaceX客户运营和集…

聆听
2024年1月12日
44900
新闻

Realme 12系列迎来第五位成员：Realme 12x 5G

Realme的12系列设备已经有四款成员 – 12、12+、12 Pro和12 Pro+，但显然这还不够。所以，很快就会有第五款：Realme 12x 5G。该手机已…

暴雨
2024年3月14日
61300
新闻

2024年中国智能手机市场大盘点：华为Mate 60系列销量暴涨64%，苹果小米OPPOvivo齐跌

2024年初，中国智能手机市场出现了截然不同的态势，华为Mate 60系列的强劲表现推动了市场大变革，与此同时，苹果、小米、OPPO和vivo等品牌的销量却普遍下跌。根据Coun…

暴雨
2024年3月8日
78400
新闻

T-Mobile宣布T-Mobile Tuesdays应用迎来重大升级

T-Mobile一直是不断进行的5G竞争中的领先者，为了在2024年开始时引起人们的兴趣，该运营商宣布T-Mobile Tuesdays应用将迎来一次重大变革。简而言之，该应用将不…

玩机客
2024年1月4日
41600
安卓

三星宣布7月10日Galaxy Unpacked活动，将发布新设备，预订现已开放

三星将在2023年7月10日于法国巴黎举办即将到来的Galaxy Unpacked活动，届时将发布新一代Galaxy AI设备，并展示不断扩展的Galaxy生态系统。本次活动的焦点…

cl15
2024年6月28日
43800
安卓

Xiaomi小米14 UItra曝光年后有望发布

据外媒报道，小米14 UItra有望在春节后发布，新机除了拥有长焦焦距、超声波指纹外，这次还要搭载卫星通信技术。此前，网上曾有消息显示，小米14 UItra支持卫星通话功能，同样…

暴雨
2023年12月12日
32300
新闻

Micromobility.com被纳斯达克摘牌

据监管文件透露，曾名为Helbiz的Micromobility.com于周一被纳斯达克摘牌，原因是该公司未能遵守证券交易所的上市规则。竞争对手Bird，作为另一家冒险进入公开市场…

Ai-i
2023年12月20日
30000
新闻

OpenAI推出Sora模型：一句话生成1分钟视频，接近实景效果

近日，OpenAI发布了全新的Sora模型，可根据用户提供的文本描述生成视频内容，引起了广泛关注。这一模型的推出标志着人工智能在理解和模拟真实世界场景方面迈出了重要的一步。 Sor…

玩机客
2024年2月18日
53400
新闻

谷歌同意支付3.5亿美元解决Google+用户数据泄露诉讼

Alphabet旗下的谷歌已经同意支付3.5亿美元，以解决罗德岛州政府对其前社交网络Google+个人数据泄露事件提起的诉讼。这项和解是对谷歌在2018年发现数据泄露后采取的行动的…

Android
2024年2月7日
43500
iPhone

苹果iPhone 17 Pro Max或将配备48MP远摄镜头

时间过得真快，尤其是在iPhone的世界里。转眼之间，我们还在为iPhone 15系列感到兴奋，而现在已经有关于下一代iPhone 16甚至iPhone 17的传闻了。据MacR…

cl15
2023年12月18日
56700
新闻

Berachain登场：技术创新、文化独特、市场适应性三维魅力

Berachain作为基于Cosmos SDK的EVM兼容L1生态系统，正以其技术创新、独特文化和市场适应性吸引着众多关注。从技术、文化和市场适应性三个维度，Berachain展现…

Ai-i
2024年1月13日
55200
新闻

欧盟将扩大对AI初创公司的支持，利用超级计算机进行模型训练

欧盟计划通过为本土AI初创公司提供超级计算机的处理能力，来支持它们进行模型训练。法国的Mistral AI已参与早期试点。然而，一个早期的教训是该计划需要为AI初创公司提供专门的支…

Ai-i
2023年12月20日
29100
安卓

购买三星Galaxy Z Fold 5还是等待Z Fold 6？如何做出选择

如果你正在考虑购买一款折叠手机，三星Galaxy Z Fold 5毫无疑问是你能找到的最佳选择之一。特别是考虑到三星在折叠手机市场已经有五年的经验。但是，三星Galaxy Z F…

Ai-i
2024年3月22日
1.8K00

YouTuber使用OpenAI的GPT-4重新制作“伪造”的Google Gemini视频

相关推荐

發佈留言

Share To :