谷歌
OpenAI被偷家,谷歌Veo 2反超Sora
视频生成领先 OpenAI 了? 今天是个好日子,至少谷歌这么想。 几个小时前,该公司一键三连,一口气发布了两款视觉生成模型和一个工具:Veo 2:视频生成模型,可使用文本或图像 prompt 生成高真实感、高质量的视频;Imagen 3:文生图模型,可更忠实地遵从提示词,实现更加丰富的细节和纹理渲染;Whisk:图生图工具,基于 Imagen 3 与 Gemini 的视觉理解和描述能力打造,能让用户更加方便地调整图像的场景、风格和物体。
12/17/2024 8:49:00 PM
机器之心
语言游戏让AI自我进化,谷歌DeepMind推出苏格拉底式学习
没有外部数据,AI自己也能进化? 听起来有点吓人,于是谷歌DeepMind的这项研究很快引起了广泛关注。 图片论文地址:「苏格拉底式学习」(Socratic Learning),能够使AI系统自主递归增强,超越初始训练数据的限制。
12/17/2024 12:53:45 PM
新智元
谷歌最强文生图 AI 模型 Imagen 3 再进化:多样艺术风格、构图更平衡
谷歌公司昨日(12 月 16 日)发布博文,在发布 Veo 2 视频生成模型之外,还增强了 Imagen 3 文生图 AI 模型,为用户带来更多花样的艺术风格。
12/17/2024 10:01:08 AM
故渊
谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图
谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。
12/17/2024 9:16:36 AM
远洋
谷歌 NotebookLM 新功能上线:用户可与 AI 主播进行互动
谷歌也提醒,这仍是一个“实验性功能”,主持人在回答时可能会有“尴尬的停顿”,甚至偶尔出现不准确的回答,所以初期使用体验可能并不完美。
12/14/2024 10:21:18 AM
清源
哈佛大学、谷歌发布 100 万本公共领域书籍,为 AI 训练提供合法数据
早在今年3月,哈佛大学就曾透露其“机构数据计划(IDI)”,并表示这一计划旨在为AI提供“合法数据的可信通道”。直到正式启动后,该计划才确认得到了微软和OpenAI的资金支持。
12/13/2024 9:02:21 AM
清源
谷歌发布多模态直播 API:解锁看、听、说,开启 AI 音视频交互新体验
谷歌昨日在发布 Gemini 2.0 的同时,还发布了全新的多模态直播(Multimodal Live)API,帮助开发人员开发具有实时音频和视频流功能的应用程序。
12/13/2024 8:44:18 AM
故渊
谷歌最强大模型Gemini 2.0被抬上来了,网友:好科幻
能搜网页、写代码,还能教你打游戏。 OpenAI 接连几天的「轰炸」,已经让人审美疲劳。 作为应对,周三,谷歌推出新一代至强 AI 大模型 Gemini 2.0 Flash 。
12/12/2024 5:17:00 PM
机器之心
谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物
美国时间周三,谷歌发布了一款可以自主浏览网站的智能体(A.I. agent)。这种实验性工具能够浏览电子表格、购物网站以及其他在线服务,然后代表用户执行操作。
12/12/2024 3:14:44 PM
辰辰
谷歌量子芯片Willow炸翻了科技圈:攻克30年量子难题,网友:谷歌又行了!
出品 | 51CTO技术栈(微信号:blog51cto)12月10日,谷歌一项发布震惊了整个AI圈,谷歌 CEO 皮查伊激动地宣布,谷歌最新的量子计算芯片 Willow 已经问世! 基准测试中,Willow 取得了惊人的成绩:在不到 5 分钟内完成了一项标准计算,而这需要顶尖超算超过 10^25 年——比宇宙年龄还长! 消息一出,连马斯克都惊叹:“Wow!
12/12/2024 3:09:26 PM
谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议
就在Gemini 2.0发布之前几天,一位新晋华人博士宣布加入Google DeepMind,作为高级研究科学家致力于Gemini预训练和多模态研究。 薛复昭,博士毕业于新加坡国立大学师从尤洋教授,2021年以5.0的GPA成绩硕士毕业于南洋理工大学,师从庄永聪教授和孙爱欣教授。 在新加坡国立大学攻读博士期间,曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习,并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。
12/12/2024 2:00:00 PM
新智元
OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1
OpenAI Day 5,风头被谷歌再一次抢了。 就在刚刚,谷歌CEO劈柴、DeepMind CEO哈萨比斯、DeepMind CTO Kavukcuoglu三位大佬联手官宣:新一代原生多模态模型Gemini 2.0 Flash正式发布! 至此,Gemini正式进入2.0时代!
12/12/2024 11:29:51 AM
新智元
谷歌:“AI 概览”功能计划明年面向更多国家、更多语言开放
谷歌首席执行官桑达尔·皮查伊表示,会将Gemini 2.0的高级推理能力融入AI Overviews(AI概览),未来将能够处理“更复杂的主题”以及“多模态”和“多步骤”的搜索,包括高级数学问题和编程问题。
12/12/2024 10:57:08 AM
清源
谷歌推出“深度研究”AI 工具,可一键生成调研报告
谷歌今日推出了一款名为“深度研究”(Deep Research)的全新人工智能工具,该工具能够利用其 Gemini 大型语言模型进行网络信息检索,并为用户生成详细的调研报告。
12/12/2024 9:43:11 AM
远洋
抢跑OpenAI!谷歌Gemini 2.0震撼登场:全面转向Agent,多模态输入输出,免费随便玩
Gemini 2.0 Flash是2.0家族第一个模型,主推原生多模态输入输出 Agent,速度比 1.5 Pro 快两倍,关键性能指标甚至超过了 1.5 Pro! 支持原生工具调用、以及实时音视频流输入等新功能谷歌CEO劈柴哥,谷歌DeepMind CEO 诺奖获得者Demis Hassabis,谷歌DeepMind CTO罕见齐下场共同撰文为Gemini 2.0 Flash的推出当啦啦队重点功能:更强性能: 速度更快,多模态、文本、代码、视频、空间理解和推理能力全面提升! 新能力比如空间理解,视频理解等可以通过Googele AI Studio 的Starter Apps来体验例如1,Gemini 2.0对空间的理解,利用Spatial Understanding,上传一张图片,Gemini快速进行图像中的物体检测(2D和3D形式都可以)和标注,并生成结构化的数据(JSON格式)。
12/12/2024 9:09:24 AM
AI寒武纪
谷歌测试 Gemini AI 游戏助手:实时分析屏幕以提供游戏建议
谷歌今日发布了 Gemini 2.0,并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则,从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示,这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理,并通过实时对话为玩家提供后续操作建议。”他们还提到,这些助手还可以“利用谷歌搜索,将玩家与网络上丰富的游戏知识连接起来。”
12/12/2024 9:02:04 AM
远洋
谷歌推出 AI 代码助手 Jules,可帮助开发者修复代码错误
谷歌今日宣布推出一款名为“Jules”的实验性 AI 代码助手,旨在帮助开发者自动修复代码错误。该工具今日与 Gemini 2.0 一同发布,其使用更新后的谷歌人工智能模型来创建多步骤计划,以解决问题、修改多个文件,并为 GitHub 工作流中的 Python 和 Javascript 编码任务准备拉取请求。
12/12/2024 8:30:42 AM
远洋
谷歌称 Project Astra 将开启测试,部分人员通过智能眼镜体验 AI 助手
在 Gemini 2.0 发布前的媒体简报会上,谷歌 DeepMind 团队的产品经理 Bibo Xu 透露,“一小部分人将通过原型眼镜测试 Project Astra,我们认为这是体验此类 AI 最强大、最直观的方式之一。”这部分测试人员将隶属于谷歌的 Trusted Tester 项目,该项目通常能够接触到这些早期原型,其中许多原型最终并不会公开发布。据悉,部分测试人员将通过安卓手机使用 Astra,而另一部分则通过眼镜进行体验。
12/12/2024 8:19:47 AM
远洋
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉