防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

Android • 2024年4月1日 18:00:00 • AI • 407 views

3 月 31 日消息，无论当下 AI 聊天机器人有多么强大，都会或多或少存在一大饱受诟病的行为 —— 以看上去令人信服的方式，向用户提供与事实不符的回答。简单来说，AI 有时会在回答中“满口跑火车”，甚至“造谣”。

防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

图源 Pixabay

防止 AI 大模型出现这种行为并非易事，且是一项技术性的挑战。不过据外媒 Marktechpost 报道，谷歌 DeepMind 和斯坦福大学似乎找到了某种变通办法。

研究人员推出了一种基于大语言模型的工具 —— 搜索增强事实评估器（IT之家注：原名为 Search-Augmented Factuality Evaluator，简称 SAFE），可对聊天机器人生成的长回复进行事实核查。其研究结果与实验代码、数据集现已公布，点此查看

该系统可通过四个步骤对聊天机器人生成的回复进行分析、处理和评估，以验证准确性和真实性：将答案分割成单个待核查内容、对上述内容进行修正、再与谷歌搜索结果进行比较。随后，该系统还会检查各个事实与原始问题的相关性。

为评估其性能，研究人员创建了包含约 16000 个事实的数据集 LongFact，并在来自 Claude、Gemini、GPT、PaLM-2 的 13 个大语言模型上测试了该系统。结果显示，在对 100 个有争议的事实进行的重点分析中，SAFE 的判定在进一步审查下正确率达到 76% 。与此同时，该框架还具备经济性优势：成本比人工注释便宜 20 多倍。

本文来自网络转载，不代表TePhone特锋手机网立场，原文出处：IT之家；原文链接：ithome.com/0/759/248.htm

AI 事实核查工具 AI 聊天机器人斯坦福大学谷歌 Deepmind

Like (0)

Android作者

0 0

谷歌：手机运行人工智能模型将占用大量内存

Previous 2024年4月1日 17:00:00

AT&T数据泄露影响数百万用户

Next 2024年4月1日 19:00:00

AI

苹果移除利用生成式AI生成裸体图片的应用

近日，有关华为手机AI功能“去衣”存在问题的报道引起了广泛关注。而类似的问题也在苹果公司的App Store中浮出水面，引发了人们对于隐私保护和应用审核的关注。据404 Medi…

Tech News
2024年4月30日
1.0K00
AI

三星将Galaxy AI与Bixby集成; 增加了语音启用的人工智能功能

在一月份的Galaxy Unpacked活动上，三星推出了名为Galaxy AI的新一套人工智能（AI）功能，与Galaxy S24系列的发布同时进行。Galaxy S24系列引入…

暴雨
2024年2月22日
1.0K00
AI

realme 真我 GT6 手机“AI 传送门”功能公布，支持跨应用交互

7 月 7 日消息，今天下午，realme 在一段预热视频中公布了真我 GT6 手机“AI 传送门”功能，号称“更高效的跨应用交互形式，一按一拖传送直达”。 ▲ 视频截图，下同从…

binbin
2024年7月8日
1.0K00
AI

苹果发布关于新型 ‘MM1’ 人工智能模型的详细信息

苹果的研究人员开发了一种新的方法，用于训练大型语言模型（LLMs），该方法无缝地整合了文本和视觉信息。该公司的研究成果详细介绍在一篇名为《MM1: 多模态LLM预训练方法、分析与…

暴雨
2024年3月19日
55900
AI

Google 发布最新 AI 媒体创作模型 Veo 和 Imagen 3

在今年的 Google I/O 大会上，Google 全力展示了其最新的 AI 媒体创作引擎：Veo 和 Imagen 3。Veo 可以生成高质量的 1080p 视频，而 Imag…

小雨
2024年5月16日
67800
AI

iOS 18即将推出：AI照片编辑、改进的Siri和全新通知系统

苹果公司的年度全球开发者大会（WWDC 24）即将到来，外界普遍预计苹果将推出其AI驱动的iOS 18，这被称为“iOS历史上最大的一次革新之一”。根据彭博社记者Mark Gur…

cl15
2024年5月28日
54300
AI

谷歌 Pixel 8 手机将引入 Gemini Nano 本地模型：可总结录音、生成信息

3 月 29 日消息，谷歌在去年 12 月发布的 Feature Drop 中，为 Pixel 8 Pro 手机引入了 Gemini 大语言模型；谷歌在今天发布的新闻稿中，宣布下一…

Tech News
2024年3月30日
41400
AI

三星Galaxy Z Fold 5和其他顶级设备获得新的AI功能和实时翻译

三星正在将OneUI 6.1扩展到Galaxy生态系统中的多款设备上。随着最新的更新推出，此前仅限于Galaxy S24系列的人工智能功能将会出现在三星最佳手机和平板电脑上。支持…

小雨
2024年3月31日
1.6K00
AI

谷歌Gemini AI助手问题修复进展顺利，拒绝响应比例减半

谷歌最近对其人工智能项目进行了一次重大更新，将其AI助手从Bard改名为Gemini，并且引入了许多新功能，包括移动端的支持。然而，Gemini在初期推出时并非完美无缺。推出速度较…

Android
2024年2月19日
42900
AI

苹果“AI”首测、通话录音上线！iOS 18.1 开发者预览版 Beta 发布，iPhone 15 Pro / Max 独享

7月30日消息，苹果今日向iPhone和iPad用户推送了iOS 18.1和iPadOS 18.1开发者预览版Beta更新（内部版本号：22B5007p），本次更新距离上次发布Be…

cl15
2024年7月30日
60400
AI

Apple发布iOS 18：你的iPhone是否兼容？以下是适用设备和新功能介绍

Apple于周一发布了全新的iOS 18系统，所有兼容的iPhone用户现在可以安装这一更新。iOS 18将会预装在全新的iPhone 16和iPhone 16 Pro机型上，这些…

小雨
2024年9月19日
3.8K00
AI

观看 Google 对其充满人工智能的 I/O 主题演讲进行 10 分钟回顾

周二，谷歌在其年度 I/O 盛会上，在持续近两个小时的主题演讲中推出了一系列生成式人工智能产品。如果您当时无法观看，或者真的不想在 Google 的 YouTube 频道上观看全…

Android
2024年5月15日
36800
AI

Rabbit R1即将入驻家庭：美国预购订单下周开始发货

今年早些时候，Rabbit R1在2024年CES展会上给科技界留下了深刻印象。现在，确认前1万台这款创新的AI动力设备将发送给在美国和加拿大预订的早期用户。据Rabbit（通过…

Ai-i
2024年3月27日
51100
AI

Logic Pro 2 提醒我们，苹果的人工智能野心不仅仅是聊天机器人

虽然苹果5 月 7 日特别活动的焦点主要是硬件——四台新 iPad、一支新 Apple Pencil 和一款新 Magic Keyboard——但也提到了 M2 和 M4 芯片的人…

小雨
2024年5月9日
36000
AI

三星Galaxy AI评测：有多实用？

自推出以来，One UI一直是三星粉丝极度关注的话题，但自从Galaxy S24系列上市以来，关注焦点已经被Galaxy AI所夺取。三星在Galaxy S24系列（以及一些旧款…

Ai-i
2024年5月11日
53000
AI

初探苹果智能与升级后的 Siri：更智能的语音助手

苹果公司最新的 iOS 18 开发者预览版中，Siri 迎来了重大升级。这次升级不仅改进了 Siri 的语言理解能力，还引入了全新的 Apple Intelligence 功能，让…

Tech News
2024年8月3日
82400
AI

Apple Intelligence：发布日期、功能、隐私等全面解析

Apple Intelligence 是苹果公司推出的全新人工智能技术，旨在通过先进的机器学习和AI能力，彻底改变我们与科技互动的方式，将其无缝融入日常设备中。 Apple Int…

cl15
2024年8月2日
1.3K00
AI

Google I/O 2024预览：如何让谷歌成为AI优先公司

在2016年和2017年的I/O大会上，Sundar Pichai表示谷歌正在从“以移动为先到以人工智能为先”转变。这涉及“重新思考所有产品并应用机器学习”，其中搜索照片和智能回复…

小雨
2024年5月13日
39700
AI

MWC 2024：惊喜不断，三星智能戒指和谷歌AI特性引领潮流

TechCrunch团队本周在巴塞罗那为您带来2024年世界移动通信大会（MWC）上的所有动态。期待已久的新产品发布不断，包括三星的智能戒指和谷歌的AI特性。坐下来，放松，随着我们…

Android
2024年2月27日
55000
AI

MWC 2024：联想首次展示透明屏笔记本和自适应智能手机

2024年2月26日，世界移动通信大会（MWC）在西班牙巴塞罗那盛大开幕。在此次MWC上，联想集团带来了一场技术创新的盛宴，展示了全景式AI终端、基础设施和解决方案，同时推出了两款…

小雨
2024年2月26日
65400

防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

相关推荐

發佈留言

Share To :