谷歌推出 Gemini Omni:动嘴即可画图修大片,AI 主动帮你搞定
2026-05-21 09:57:20
5 月 20 日消息:在 Google I/O 2026 上,谷歌正式发布 Gemini Omni 模型。该模型支持文本、图像、音频、视频作为输入,实现跨模态生成与编辑。
其中在音频方面,目前该模型初期仅支持语音输入,但Google表示未来将很快扩展更多类型的音频输入能力。
首发产品Gemini Omni Flash已在Gemini应用上线,后续将向企业客户开放API。
该模型核心卖点在于深度视频编辑能力。用户通过自然语言指令即可对生成内容持续迭代,包括添加或删除对象、切换摄像机角度、修改环境与风格。
得益于模型对物理规律的理解以及对历史、科学、文化知识的整合,生成的视频在角色、场景及视觉逻辑上高度连贯,甚至能推测后续情节。用户亦可创建个人数字分身,并将其植入视频中。
谷歌在安全领域同步布局,所有通过Omni生成的视频均会自动嵌入SynthID数字水印,支持通过Google搜索及Chrome验证。
Gemini Omni Flash 现已面向拥有 Google AI Plus/Pro/Ultra 订阅的用户在 Gemini 应用和 Google Flow 中推出。此外,它还免费向希望混剪 YouTube Shorts 的用户以及 YouTube Create 应用用户推出。
Google DeepMind负责人哈萨比斯表示,该模型正推动AI从单纯的任务执行向通用人工智能(AGI)迈进。
声明:文章不代表量链科技观点及立场,不构成本平台任何投资建议。投资决策需建立在独立思考之上,本文内容仅供参考,风险自担!转载请注明出处!侵权必究!
相关阅读
-
加密诈骗真实案例:一人如何损失 4850 澳元及防骗指南区块链快讯 2026-05-21 09:53:37
-
英特尔玻璃基板实物首曝:告别铜线,揭秘下一代 AI 芯片真容金融科技前沿 2026-05-21 09:52:29
-
华为 MatePad Edge 迎鸿蒙 6.1 重磅更新:二合一平板更流畅、更安全深度解读 2026-05-21 09:51:51
-
iQOO 15T 正式发布:首发天玑 9500 最强版,3299 元起深度解读 2026-05-21 09:46:54
-
空投诈骗常见手法大揭秘:如何识别陷阱并避免损失?区块链快讯 2026-05-21 09:43:53
-
美图秀秀调色在哪里?美图秀秀调色查看方法资讯百科 2026-05-21 09:40:57
-
3799 元起!一图读懂 iQOO Pad6 Pro:4K 板皇畅享 5 年流畅深度解读 2026-05-21 09:40:55
-
REDMI K90 Max 定价保守引热议:含金量飙升,性能大杀四方深度解读 2026-05-21 09:35:48
-
Hyperliquid 年营收剑指 10 亿美元:HYPE 币是否被严重低估?区块链快讯 2026-05-21 09:34:53
-
张雪机车车手德比斯首秀:10 战 5 冠战绩,15 万人预约见证深度解读 2026-05-21 09:30:06