当大家还在沉浸在OpenAI Sora的兴奋时
千万不要忽略Google Gemini Pro 1.5的威力,绝对也是王炸级别的更新。
Gemini 1.5 Pro能够跨模态进行高度复杂的理解和推理
例如,它能读取分析44分钟的1924年的无声电影并准确捕捉情节要点和细节。
甚至能够基于一张简单的线条画识别出电影中的特定场景。
这表明该模型不仅能够处理和理解长篇文本,还能够理解和分析图像和视频内容,进而识别和推理出与之相关的具体情节和细节。
这是GPT 4目前做不到的!
44分钟的无声电影 Sherlock Jr. (1924):https://t.co/dRtur6d4cA