谷歌
谷歌首个通用推理模型登场:揭秘 AI 推理“黑匣子”,登顶 Arena LLM 排行榜
谷歌 AI Studio 平台昨日(12 月 19 日)发布实验性的“Gemini 2.0 Flash Thinking”模型,主打“清晰展现思考过程”,是谷歌第一个通用推理模型。
12/20/2024 7:58:12 AM
故渊
谷歌新规引担忧:消息称外包人员被迫评估自己不擅长的 Gemini 回复
据 TechCrunch 报道,谷歌针对其大型语言模型 Gemini 回复的外包评估流程进行了一项调整,引发了外界对其在敏感领域信息准确性的担忧。这项调整要求外包评估员不得再像以往那样,因自身专业知识不足而跳过某些特定的评估任务,这或将导致 Gemini 在医疗保健等高度专业性领域的信息输出出现偏差。
12/19/2024 10:19:53 AM
远洋
谷歌发布 FACTS Grounding 基准:Gemini、GPT-4o、Claude 当评委,成 AI 大语言模型“幻觉照妖镜”
12 月 18 日消息,谷歌 DeepMind 团队于 12 月 17 日发布博文,宣布推出 FACTS Grounding 基准测试,评估大型语言模型(LLMs)根据给定材料是否准确作答,并避免“幻觉”(即捏造信息)的能力,从而提升 LLMs 的事实准确性,增强用户信任度,并拓展其应用范围。 数据集在数据集方面,ACTS Grounding 数据集包含 1719 个示例,涵盖金融、科技、零售、医疗和法律等多个领域,每个示例包含一篇文档、一条要求 LLM 基于文档的系统指令和随附的提示词。 示例文档长度不一,最长可达 32000 个 token(约 20000 字)。
12/18/2024 1:24:30 PM
故渊
谷歌:只要有人工监督,客户即可在“高风险”领域使用其 AI 作出决策
根据该公司周二发布的《生成式 AI 禁止使用政策》更新版,客户可以在一定条件下使用谷歌的生成式 AI 作出可能对个人权利产生重大不利影响的“自动化决策”,例如在就业、住房、保险和社会福利等领域。
12/18/2024 7:12:19 AM
清源
OpenAI被偷家,谷歌Veo 2反超Sora
视频生成领先 OpenAI 了? 今天是个好日子,至少谷歌这么想。 几个小时前,该公司一键三连,一口气发布了两款视觉生成模型和一个工具:Veo 2:视频生成模型,可使用文本或图像 prompt 生成高真实感、高质量的视频;Imagen 3:文生图模型,可更忠实地遵从提示词,实现更加丰富的细节和纹理渲染;Whisk:图生图工具,基于 Imagen 3 与 Gemini 的视觉理解和描述能力打造,能让用户更加方便地调整图像的场景、风格和物体。
12/17/2024 8:49:00 PM
机器之心
语言游戏让AI自我进化,谷歌DeepMind推出苏格拉底式学习
没有外部数据,AI自己也能进化? 听起来有点吓人,于是谷歌DeepMind的这项研究很快引起了广泛关注。 图片论文地址:「苏格拉底式学习」(Socratic Learning),能够使AI系统自主递归增强,超越初始训练数据的限制。
12/17/2024 12:53:45 PM
新智元
谷歌最强文生图 AI 模型 Imagen 3 再进化:多样艺术风格、构图更平衡
谷歌公司昨日(12 月 16 日)发布博文,在发布 Veo 2 视频生成模型之外,还增强了 Imagen 3 文生图 AI 模型,为用户带来更多花样的艺术风格。
12/17/2024 10:01:08 AM
故渊
谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图
谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定 AI 生成图像的主题、场景和风格。
12/17/2024 9:16:36 AM
远洋
谷歌 NotebookLM 新功能上线:用户可与 AI 主播进行互动
谷歌也提醒,这仍是一个“实验性功能”,主持人在回答时可能会有“尴尬的停顿”,甚至偶尔出现不准确的回答,所以初期使用体验可能并不完美。
12/14/2024 10:21:18 AM
清源
哈佛大学、谷歌发布 100 万本公共领域书籍,为 AI 训练提供合法数据
早在今年3月,哈佛大学就曾透露其“机构数据计划(IDI)”,并表示这一计划旨在为AI提供“合法数据的可信通道”。直到正式启动后,该计划才确认得到了微软和OpenAI的资金支持。
12/13/2024 9:02:21 AM
清源
谷歌发布多模态直播 API:解锁看、听、说,开启 AI 音视频交互新体验
谷歌昨日在发布 Gemini 2.0 的同时,还发布了全新的多模态直播(Multimodal Live)API,帮助开发人员开发具有实时音频和视频流功能的应用程序。
12/13/2024 8:44:18 AM
故渊
谷歌最强大模型Gemini 2.0被抬上来了,网友:好科幻
能搜网页、写代码,还能教你打游戏。 OpenAI 接连几天的「轰炸」,已经让人审美疲劳。 作为应对,周三,谷歌推出新一代至强 AI 大模型 Gemini 2.0 Flash 。
12/12/2024 5:17:00 PM
机器之心
谷歌发布智能体原型 Mariner,能帮用户操作表格、在线购物
美国时间周三,谷歌发布了一款可以自主浏览网站的智能体(A.I. agent)。这种实验性工具能够浏览电子表格、购物网站以及其他在线服务,然后代表用户执行操作。
12/12/2024 3:14:44 PM
辰辰
谷歌量子芯片Willow炸翻了科技圈:攻克30年量子难题,网友:谷歌又行了!
出品 | 51CTO技术栈(微信号:blog51cto)12月10日,谷歌一项发布震惊了整个AI圈,谷歌 CEO 皮查伊激动地宣布,谷歌最新的量子计算芯片 Willow 已经问世! 基准测试中,Willow 取得了惊人的成绩:在不到 5 分钟内完成了一项标准计算,而这需要顶尖超算超过 10^25 年——比宇宙年龄还长! 消息一出,连马斯克都惊叹:“Wow!
12/12/2024 3:09:26 PM
谷歌Gemini再添猛将!GPA 5.0毕业即DeepMind高级科学家,开挂博士给科研新人7点建议
就在Gemini 2.0发布之前几天,一位新晋华人博士宣布加入Google DeepMind,作为高级研究科学家致力于Gemini预训练和多模态研究。 薛复昭,博士毕业于新加坡国立大学师从尤洋教授,2021年以5.0的GPA成绩硕士毕业于南洋理工大学,师从庄永聪教授和孙爱欣教授。 在新加坡国立大学攻读博士期间,曾在Google Brain与谷歌天才科学家Yi Tay和Mostafa Dehghani一起实习,并在NVIDIA GEAR与Jim Fan和Yuke Zhu一起实习。
12/12/2024 2:00:00 PM
新智元
OpenAI深夜被狙,谷歌Gemini 2.0掀翻牌桌!最强智能体组团击毙o1
OpenAI Day 5,风头被谷歌再一次抢了。 就在刚刚,谷歌CEO劈柴、DeepMind CEO哈萨比斯、DeepMind CTO Kavukcuoglu三位大佬联手官宣:新一代原生多模态模型Gemini 2.0 Flash正式发布! 至此,Gemini正式进入2.0时代!
12/12/2024 11:29:51 AM
新智元
谷歌:“AI 概览”功能计划明年面向更多国家、更多语言开放
谷歌首席执行官桑达尔·皮查伊表示,会将Gemini 2.0的高级推理能力融入AI Overviews(AI概览),未来将能够处理“更复杂的主题”以及“多模态”和“多步骤”的搜索,包括高级数学问题和编程问题。
12/12/2024 10:57:08 AM
清源
谷歌推出“深度研究”AI 工具,可一键生成调研报告
谷歌今日推出了一款名为“深度研究”(Deep Research)的全新人工智能工具,该工具能够利用其 Gemini 大型语言模型进行网络信息检索,并为用户生成详细的调研报告。
12/12/2024 9:43:11 AM
远洋
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
人形机器人
生成式
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
GPU
生成
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉