谷歌宣布推出人工智能模型 "双子座"。双子座是谷歌迄今为止功能最强大、用途最广泛的人工智能模型,能够同时理解、处理和组合文本、代码、音频、图像和视频等不同类型的信息。
最先进的性能
谷歌推出的原生多模态人工智能模型 "双子座 "强调从零开始创建模块化人工智能模型。与人类拥有五种感官并同时感知和感知世界的方式类似,Gemini 也能全面、无缝地理解、处理和组合文本、代码、音频、图像和视频等不同类型的信息。
这种能力超越了其他单独构建的文本或语音模型的有效性,这些模型随后被连接起来以产生结果。
谷歌对 Gemini 模型进行了严格测试,并评估了其在各种任务中的性能。从自然图像、音频和视频理解到数学推理,在用于开发大型语言模型(LLM)的 32 个广泛使用的学术基准中,Gemini Ultra 的性能在 30 个基准中都超过了当前最先进的结果。
超越人类
最高级别的 Gemini Ultra 得分高达 90.0%,成为首个在 MMLU(大规模多任务语言理解)方面超越人类专家的模型。
三个版本
Gemini 是我们迄今为止适应性最强的模型,能够在从数据中心到移动设备的各种平台上高效运行。其先进的功能将大大改善开发人员和企业客户利用人工智能的开发和可扩展性选择。
谷歌优化了双子座 1.0,这是他们的第一个版本,有三种不同的尺寸:
-Gemini Ultra - 最大、功能最强大的机型,适用于高度复杂的任务。
-Gemini Pro - 最适合在各种任务中进行扩展的型号。
-Gemini Nano - 执行设备任务的最高效型号。
巴德的参与
谷歌的人工智能聊天机器人巴德(Bard)已经开始使用改进版的双子座专业版(Gemini Pro)来执行高级推理、规划、理解等功能。这是自巴德推出以来最大的一次升级。它将在 170 多个国家和地区使用英语,并计划在不久的将来扩展到不同的模式,支持新的语言和地区。
无需互联网
谷歌还将 Gemini 引入了 Pixel。Pixel 8 Pro 是首款运行 Gemini Nano 的智能手机,支持录音应用中的 'Summarize'等新功能。这不需要互联网连接,就能在手机上使用 Gemini 从录制的文件中整理会议摘要。从 WhatsApp 开始,他们将在 Gboard 中推出智能回复功能,明年还将推出更多应用。
谷歌和 Alphabet 首席执行官桑达尔-皮查伊(Sundar Pichai)表示、
这正是让我感到兴奋的地方:让人工智能帮助世界上任何地方的每一个人的机会";