谷歌
谷歌:只要有人工监督,客户即可在“高风险”领域使用其 AI 作出决策
根据该公司周二发布的《生成式 AI 禁止使用政策》更新版,客户可以在一定条件下使用谷歌的生成式 AI 作出可能对个人权利产生重大不利影响的“自动化决策”,例如在就业、住房、保险和社会福利等领域。
OpenAI被偷家,谷歌Veo 2反超Sora
视频生成领先 OpenAI 了? 今天是个好日子,至少谷歌这么想。 几个小时前,该公司一键三连,一口气发布了两款视觉生成模型和一个工具:Veo 2:视频生成模型,可使用文本或图像 prompt 生成高真实感、高质量的视频;Imagen 3:文生图模型,可更忠实地遵从提示词,实现更加丰富的细节和纹理渲染;Whisk:图生图工具,基于 Imagen 3 与 Gemini 的视觉理解和描述能力打造,能让用户更加方便地调整图像的场景、风格和物体。
语言游戏让AI自我进化,谷歌DeepMind推出苏格拉底式学习
没有外部数据,AI自己也能进化? 听起来有点吓人,于是谷歌DeepMind的这项研究很快引起了广泛关注。 图片论文地址:「苏格拉底式学习」(Socratic Learning),能够使AI系统自主递归增强,超越初始训练数据的限制。
谷歌最强文生图 AI 模型 Imagen 3 再进化:多样艺术风格、构图更平衡
谷歌公司昨日(12 月 16 日)发布博文,在发布 Veo 2 视频生成模型之外,还增强了 Imagen 3 文生图 AI 模型,为用户带来更多花样的艺术风格。
谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图
谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。
谷歌 NotebookLM 新功能上线:用户可与 AI 主播进行互动
谷歌也提醒,这仍是一个“实验性功能”,主持人在回答时可能会有“尴尬的停顿”,甚至偶尔出现不准确的回答,所以初期使用体验可能并不完美。
哈佛大学、谷歌发布 100 万本公共领域书籍,为 AI 训练提供合法数据
早在今年3月,哈佛大学就曾透露其“机构数据计划(IDI)”,并表示这一计划旨在为AI提供“合法数据的可信通道”。直到正式启动后,该计划才确认得到了微软和OpenAI的资金支持。
谷歌发布多模态直播 API:解锁看、听、说,开启 AI 音视频交互新体验
谷歌昨日在发布 Gemini 2.0 的同时,还发布了全新的多模态直播(Multimodal Live)API,帮助开发人员开发具有实时音频和视频流功能的应用程序。
谷歌最强大模型Gemini 2.0被抬上来了,网友:好科幻
能搜网页、写代码,还能教你打游戏。 OpenAI 接连几天的「轰炸」,已经让人审美疲劳。 作为应对,周三,谷歌推出新一代至强 AI 大模型 Gemini 2.0 Flash 。
谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物
美国时间周三,谷歌发布了一款可以自主浏览网站的智能体(A.I. agent)。这种实验性工具能够浏览电子表格、购物网站以及其他在线服务,然后代表用户执行操作。
谷歌量子芯片Willow炸翻了科技圈:攻克30年量子难题,网友:谷歌又行了!
出品 | 51CTO技术栈(微信号:blog51cto)12月10日,谷歌一项发布震惊了整个AI圈,谷歌 CEO 皮查伊激动地宣布,谷歌最新的量子计算芯片 Willow 已经问世! 基准测试中,Willow 取得了惊人的成绩:在不到 5 分钟内完成了一项标准计算,而这需要顶尖超算超过 10^25 年——比宇宙年龄还长! 消息一出,连马斯克都惊叹:“Wow!
谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议
就在Gemini 2.0发布之前几天,一位新晋华人博士宣布加入Google DeepMind,作为高级研究科学家致力于Gemini预训练和多模态研究。 薛复昭,博士毕业于新加坡国立大学师从尤洋教授,2021年以5.0的GPA成绩硕士毕业于南洋理工大学,师从庄永聪教授和孙爱欣教授。 在新加坡国立大学攻读博士期间,曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习,并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。
OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1
OpenAI Day 5,风头被谷歌再一次抢了。 就在刚刚,谷歌CEO劈柴、DeepMind CEO哈萨比斯、DeepMind CTO Kavukcuoglu三位大佬联手官宣:新一代原生多模态模型Gemini 2.0 Flash正式发布! 至此,Gemini正式进入2.0时代!
谷歌:“AI 概览”功能计划明年面向更多国家、更多语言开放
谷歌首席执行官桑达尔·皮查伊表示,会将Gemini 2.0的高级推理能力融入AI Overviews(AI概览),未来将能够处理“更复杂的主题”以及“多模态”和“多步骤”的搜索,包括高级数学问题和编程问题。
谷歌推出“深度研究”AI 工具,可一键生成调研报告
谷歌今日推出了一款名为“深度研究”(Deep Research)的全新人工智能工具,该工具能够利用其 Gemini 大型语言模型进行网络信息检索,并为用户生成详细的调研报告。
抢跑OpenAI!谷歌Gemini 2.0震撼登场:全面转向Agent,多模态输入输出,免费随便玩
Gemini 2.0 Flash是2.0家族第一个模型,主推原生多模态输入输出 Agent,速度比 1.5 Pro 快两倍,关键性能指标甚至超过了 1.5 Pro! 支持原生工具调用、以及实时音视频流输入等新功能谷歌CEO劈柴哥,谷歌DeepMind CEO 诺奖获得者Demis Hassabis,谷歌DeepMind CTO罕见齐下场共同撰文为Gemini 2.0 Flash的推出当啦啦队重点功能:更强性能: 速度更快,多模态、文本、代码、视频、空间理解和推理能力全面提升! 新能力比如空间理解,视频理解等可以通过Googele AI Studio 的Starter Apps来体验例如1,Gemini 2.0对空间的理解,利用Spatial Understanding,上传一张图片,Gemini快速进行图像中的物体检测(2D和3D形式都可以)和标注,并生成结构化的数据(JSON格式)。
谷歌测试 Gemini AI 游戏助手:实时分析屏幕以提供游戏建议
谷歌今日发布了 Gemini 2.0,并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则,从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示,这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理,并通过实时对话为玩家提供后续操作建议。”他们还提到,这些助手还可以“利用谷歌搜索,将玩家与网络上丰富的游戏知识连接起来。”
谷歌推出 AI 代码助手 Jules,可帮助开发者修复代码错误
谷歌今日宣布推出一款名为“Jules”的实验性 AI 代码助手,旨在帮助开发者自动修复代码错误。该工具今日与 Gemini 2.0 一同发布,其使用更新后的谷歌人工智能模型来创建多步骤计划,以解决问题、修改多个文件,并为 GitHub 工作流中的 Python 和 Javascript 编码任务准备拉取请求。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉