

继上周推出巴德和Pixel 8 Pro之后,谷歌最近宣布的旗舰代人工智能机型系列Gemini将使用Vertex AI为谷歌云客户推出。
Gemini Pro是功能更强大的Gemini Ultra模型的轻量级版本,目前正在为“精选组”客户进行私人预览,现在可以通过新的Gemini Pro API在Google的完全管理的AI开发平台Vertex AI中进行公开预览。该API目前可以“在一定范围内”免费使用(稍后会详细介绍),支持包括欧洲在内的38种语言和地区,以及聊天功能和过滤等功能。
谷歌云首席执行官托马斯·库里安在周二的新闻发布会上表示:“双子座是一个最先进的原生多模式模型,具有复杂的推理和高级编码技能。”“(现在)开发人员将能够针对它构建自己的应用程序。”
默认情况下,Vertex中的Gemini Pro API接受文本作为输入,并生成文本作为输出,类似于Anthropic, AI21和Cohere的生成文本模型API。另外一个终端,Gemini Pro Vision,今天也发布了预览版,可以处理文本和图像(包括照片和视频),并按照OpenAI的GPT-4 with Vision模型输出文本。
图像处理解决了上周三发布后对Gemini的主要批评之一——即Gemini支持Bard的版本,即经过微调的Gemini Pro模型,尽管在技术上是“多模式”的(即在包括文本、图像、视频和音频在内的一系列数据上进行训练),但不能接受图像。人们对Gemini的图像分析表现和技能一直存在疑问,尤其是在一个误导性的产品演示中。但现在,至少用户可以自己体验这个模型和它的图像理解能力。
在Vertex AI中,开发人员可以利用与其他Vertex托管模型(如Google的PaLM 2)相同的微调工具,根据特定的环境和用例定制Gemini Pro。Gemini Pro还可以连接到外部api来执行特定操作或“接地”,以提高模型响应的准确性和相关性,可以使用来自应用程序或数据库的第三方数据,也可以使用来自网络和谷歌搜索的数据。
(Techcrunch)