2023年度最惊艳的5款人工智能工具

在科技领域,一年的时间可以发生很多变化,尤其是在2023年。过去的12个月将被视为人工智能的一年,新的模型、产品以及生成式人工智能的新用例纷纷亮相,整个科技行业也因此发生了永久性的改变。

2023年度最惊艳的5款人工智能工具

作为一个专业测试人工智能的人,我尝试过从图像生成器到视频制作工具的各种人工智能产品。我玩过那些能够从简单的文本提示中制作音乐的应用,也玩过那些能够在几秒钟内将一个声音转换成另一个声音的应用。

尽管新产品层出不穷,新模型和其他聊天机器人也纷纷亮相,但对我而言,ChatGPT仍然是我心目中的年度人工智能应用。直到我们看到Gemini Ultra对Google Bard有何影响之前,GPT-4仍然在性能上超越了所有其他人工智能模型。以下是原因。

为什么ChatGPT是我年度应用?

尽管这可能看起来是轻松明显的选择,ChatGPT之所以成为年度应用,是因为它对整个人工智能行业产生了巨大的影响。仅仅一年前,商业化的生成式人工智能在主流产品中还只是小试牛刀。而今天,我们在Windows 11中集成了聊天机器人,Photoshop中有图像生成功能,还可以在Web浏览器中无中生有地创作一首歌。这在很大程度上要归功于ChatGPT的成功。

OpenAI并没有就此满足,过去的一年里,他们对ChatGPT进行了多次升级。它从一个研究实验转变为一个有用的产品,并且变得多模态化。现在,您可以给ChatGPT一张照片,让它描述其中的内容,写一首诗,甚至生成一幅插图以配合那首诗。ChatGPT还新增了语音模式,让您可以像与Alexa或Siri一样与其互动,但回应更加智能。

2023年最佳人工智能工具 — 我的首选

今年有很多选择。这包括像Otter.ai这样将记笔记推向新水平的应用。我们不要忘记嵌入在Instagram和Facebook中的各种Meta AI工具,以及可以在您的设备上运行的开源AI模型,比如Mixtral。

最终,在今年的人工智能领域,除了ChatGPT之外,还有一些真正引人注目的时刻、服务和模型。以下是其中的一些。

1、Runway用于AI视频生成: 唯一让我质疑它是否应该成为我年度人工智能工具而非ChatGPT的程序是Runway的Gen-2。这个多模态视频人工智能模型于六月份发布,第一次使用它时,触发了我与使用ChatGPT时相似的”哇”反应。 在今年下半年,其他商业和非商业视频人工智能工具也开始出现,包括Pika Labs的令人印象深刻的Pike 1.0,StabilityAI的Stable Video Diffusion和Meta的Emu。然而,由于Runway首先亮相,表现卓越且一开始就令人印象深刻,我必须选择Runway。

2023年度最惊艳的5款人工智能工具

2、ElevenLabs的人类化语音人工智能: 虽然ElevenLabs的能力可能没有像更引人注目的图像、视频和文本生成那样受到关注,但它能够创建令人印象深刻的自然音质的合成声音以及从几分钟的音频中克隆声音,是一个亮点。 文本转语音软件并非新概念。多年来我们一直有合成音质和”朗读”功能。ElevenLabs所取得的成就是使这些声音听起来如此自然,以至于你几乎分辨不出它们是合成的。该公司还推出了一个新功能,可以将声音转换为其他声音。简而言之,您说话,它通过其人工智能声音使其听起来不同。 在这个类别中,像Hey Gen这样的其他工具也值得一提。它们展示了实时和视频翻译的潜力。它可以从无中创建一个头像,具有人工声音,或者在保持原有语调和口音的同时将一个声音翻译成另一个声音。

2023年度最惊艳的5款人工智能工具

3、MidJourney用于超逼真图像: 最佳AI图像生成器的市场竞争激烈,但我选择MidJourney是因为它一直保持领先地位。其图像风格和炫彩效果让其他模型仍在迎头赶上,而v6版本更可以在图片上添加图像。 即使在提示使其照片逼真的情况下,其他图像生成器仍然难以摆脱一定的人工或卡通的色调。MidJourney似乎能够最接近复制现实。 还要提一下建立在Stable Diffusion之上的众多模型,这是由Runway部分建造并由StabilityAI资助的开源技术。SDXL 1.0在质量上接近MidJourney,Turbo可以实时创建图像,而像Leonardo这样的公司的改编则将其推向了一个全新的性能水平。

2023年度最惊艳的5款人工智能工具

4、Anthropic的Claude 2用于大背景聊天: Anthropic的Claude 2是一个聊天机器人,它没有得到应有的赞誉。它拥有庞大的上下文窗口,具有令人印象深刻的推理和创造力技能,可以接收大文件并在几秒钟内分析其内容。 该公司还是首批致力于宪法人工智能概念的公司之一。这是一个概念,其中大型人工智能模型的行为是由宪法而不是人类反馈确定的。 在反馈方法中,模型行为是通过人类承包商的反馈来引导的,他们比较输出并选择更有帮助或更无害的输出。Anthropic的方法是在高层次为人工智能定义了一组原则,用这些原则来做出判断。 其他聊天机器人可能在不同任务上更为出色。Bard可以与其他Google产品互动,甚至分析YouTube视频。Pi操作迅速,具有令人印象深刻的推理能力,而Llama则是免费且开源的,但在安全性、上下文大小和推理方面,Claude 2具有优势。

2023年度最惊艳的5款人工智能工具

5、StabilityAI用于开源投资: 我的最后一项选择,尽管这个列表本可以更长,是StabilityAI。虽然它本身不是一个特定的模型,而是一个专注于将生成式人工智能工具的各个方面集成到一个平台上的公司。 它对Stable Diffusion进行了各种升级,通过Turbo模型增加了视频功能并提高了质量。然而,该公司还在其库中拥有3D、音频和文本生成模型。 StabilityAI的文本模型Zephyr足够小,可以安装在笔记本电脑上,并能够在没有向云端发送任何数据的情况下,迅速而合理地回答查询。其图像模型可在本地机器上免费使用非商业用途,也可以在外部产品上获得许可使用。 这种方法使得未来我们可能会在不自知的情况下都在使用由StabilityAI建造、许可或以某种方式投资的模型。一个视频编辑器,允许您从文本中添加片段,可能使用的是Stable Video Diffusion;作业应用中的文本摘要可能使用的是Zephyr;未来的音频编辑器可能会整合Stable Audio的某个版本。

2023年度最惊艳的5款人工智能工具

结论:ChatGPT是当之无愧的人工智能之王

虽然有许多令人印象深刻的人工智能工具涌现在2023年,但ChatGPT凭借其在整个行业中的深远影响、升级和多模态功能,仍然是我认为是年度人工智能应用的首选。不过,这并不妨碍其他工具在各自领域取得非凡的成就,让人们对人工智能的发展充满期待。

本文来自投稿,不代表TePhone特锋手机网立场,如若转载,请注明出处:https://www.tephone.com/article/3007

(0)
暴雨的头像暴雨编辑
上一篇 2024年1月1日 16:57:00
下一篇 2024年1月1日 20:00:00

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注