AI
消息称Google I/O大会或发布Gemini驱动的全新AI搜索引擎
有消息人士透露,Google 可能会在其年度 I/O 开发者大会上发布一款颠覆性的全新搜索引擎,该引擎的核心技术将是 Google 最新的生成式人工智能模型 Gemini。 据称,目前该新搜索模式已经开始进行小范围的灰度测试。 如果消息属实,这可能标志着 Google 将其最重要的流量入口——目前的搜索框——全面切换到基于 Gemini 的 AI 搜索引擎。
苹果AI战略受挫:升级版Siri或将错过WWDC,内部分歧导致发展滞后
彭博社记者Mark Gurman今日凌晨发布报道,详细揭示了苹果在AI领域的战略失误及内部冲突,同时披露了公司今年在AI方面的部分进展计划。 根据Gurman的报道,升级版Siri将继续"难产",发布时间可能晚于下月的全球开发者大会(WWDC)。 虽然新版Siri可能会与iOS19一同在WWDC亮相,但预计不会被重点提及,且实际发布仍需几个月的等待时间。
杭州机场推出全国首个AI大模型智能呼叫中心,服务体验再升级
杭州萧山国际机场于5月16日成功启用全国民航首个基于 AI 大模型的智能呼叫中心,标志着其96299热线进入了一个全新的智能化时代。 这一升级采用了前沿的 DeepSeek 大模型技术,旨在提升客户服务的效率和质量。 自2014年首次上线以来,96299热线为旅客提供24小时不间断的接听与在线咨询服务。
Nest 音响现蓝紫渐变灯光,Google Gemini 助手正在测试中
近期,许多用户在 Reddit 上分享了他们的 Nest Audio 扬声器显示出蓝色和紫色渐变灯光的体验,这与平时的白色 LED 灯光形成了鲜明的对比。 这一新变化引起了广泛的关注,许多用户纷纷表示也看到了这种色彩变化。 根据9to5Google 的报道,谷歌正在逐步推出其新一代 AI 助手 ——Gemini,并计划逐步取代现有的 Google Assistant。
研究称, AI 能独立自发组成社会,形成自己的规范和习俗
近日,伦敦大学城市学院与哥本哈根信息技术大学的研究人员进行了一项引人注目的实验,结果表明,人工智能(AI)能够在没有外界干预的情况下,自发形成类似人类的社会规范和习俗。 这项研究的成果已于5月14日发表在《Science Advances》杂志上,标志着 AI 群体行为研究的新进展。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项实验中,研究团队将多种 AI 智能体置于去中心化的交流环境中,模拟了人类社会中的群体互动。
Ollama推出全新多模态AI引擎,推理性能显著提升
前不久,Ollama 宣布推出一款全新的多模态 AI 引擎,这款引擎的研发是独立于原有的 llama.cpp 框架进行的,标志着公司在人工智能领域迈出了重要一步。 这一引擎是基于 Golang 编程语言开发,旨在大幅提高本地推理的精度,同时增强大型图像处理的能力。 新引擎的亮点在于其引入了图像处理元数据、KVCache 优化及图像缓存功能。
自动化研究与工具调用:Minion-Agent集成浏览器操作与MCP的智能任务框架
近日,一款名为Minion-Agent的AI智能体框架在社交媒体平台X上引发广泛关注。 这款集成了浏览器操作、MCP(Model Context Protocol)、自动工具调用、任务规划和深度研究等多种功能的智能体框架,正以其强大的自动化能力和灵活的应用场景成为AI领域的焦点。 Minion-Agent的核心能力Minion-Agent被誉为“AI助手制作套装”,其核心在于能够根据用户指令,自主完成复杂的任务流程。
OpenAI 计划在阿布扎比建造超大数据中心,规模远超摩纳哥
近日,OpenAI 与阿联酋科技公司 G42达成合作,将在阿布扎比建设一个规模巨大的数据中心园区。 这个项目将耗电达5000兆瓦,园区面积达到10平方英里,规模将成为全球最大的 AI 基础设施之一,甚至超过摩纳哥的整体面积。 这项新建的数据中心是 OpenAI “星际之门”(Stargate)计划的重要组成部分。
初创公司Firecrawl再次寻找AI代理员工,预算100万美元
Y Combinator支持的初创公司Firecrawl再次启动了招聘AI代理的计划,为此专门拨款100万美元。 该公司在YC招聘平台上发布了三个"仅限AI代理"的职位,包括内容创作代理、客服工程师和初级开发代理,每个职位月薪均为5000美元。 据Firecrawl创始人Caleb Peffer向TechCrunch透露,新职位发布约一周内就收到了约50份申请。
Stability AI与Arm推出手机级音频生成AI:7秒内创建11秒立体声
Stability AI和Arm联合发布了一款名为"稳定音频开放小型"(Stable Audio Open Small)的紧凑型文本转音频模型,该模型能够在约7秒内生成长达11秒的高质量立体声音频片段,且经过优化可在智能手机等移动设备上运行。 这一突破基于加州大学伯克利分校研究人员开发的"对抗相对对比"(Adversarial Relativistic-Contrastive,ARC)技术。 该模型在高端硬件如Nvidia H100GPU上的表现更为惊人,能够在仅75毫秒内完成44kHz立体声音频的生成,实现了近乎实时的音频合成能力。
张朝阳:如果晚生 30 年,自己也会卷入到AI里面
在最近召开的2025搜狐科技年度论坛上,搜狐创始人、董事局主席兼首席执行官张朝阳,与清华大学讲席教授张亚勤及猎豹移动董事长兼 CEO 傅盛等三位科技领域的重量级嘉宾进行了深入的讨论。 论坛围绕人工智能(AI)、人形机器人和脑科学等前沿科技展开,吸引了众多关注。 图源备注:图片由AI生成,图片授权服务商Midjourney张朝阳在讨论中表示,如果晚生30年,自己也会卷入到AI里面,包括人形机器人,脑科学。
研究:AI 聊天机器人在数据总结能力上愈加糟糕,关键细节常被遗漏
随着人工智能技术的迅猛发展,各大 AI 创业公司不断宣称其产品将工作方式和知识获取的方式。 然而,最近一项发表在《皇家学会》上的研究却揭示了新一代 AI 模型在总结文本时存在严重问题,令人担忧。 研究显示,新款 AI 聊天机器人在提供信息时,有高达73% 的概率会遗漏关键信息。
Anthropic获得25亿美元信贷支持,年收入激增至20亿美元
近日,人工智能公司 Anthropic 宣布获得了一项高达25亿美元的五年期循环信贷额度,此举旨在增强公司的财务流动性并推动业务扩展。 这家由前 OpenAI 高管创立的公司,其聊天机器人 Claude 自2023年推出以来,迅速在市场上获得了广泛关注和认可。 据悉,Anthropic 的估值已达615亿美元,而在2023年第一季度,其年化收入更是翻倍至20亿美元,显示出公司在竞争激烈的 AI 领域中正以惊人的速度成长。
矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省
天下苦大模型矩阵乘法久矣。 毕竟不论是训练还是推理过程,矩阵乘法作为最主要的计算操作之一,往往都需要消耗大量的算力。 那么就没有一种更“快、好、省”的方法来搞这事儿吗?
打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙,堪比AlphaGo“神之一手”
数学能力几乎和AlphaGo的围棋水平一样? ! 这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了「通用科学人工智能」AlphaEvolve,直接打破了矩阵乘法领域56年以来的效率基准。
硅谷60万亿终极野心!AI取代所有人类工作,拿走全部工资!
硅谷的终极野心是什么? 答案是用AI和机器人取代所有人的工作。 然后,拿走所有的工资!
Llama 4万亿巨兽延期,80%核心元老集体辞职?
Llama 4团队约80%的人集体辞职? 昨天,来自AI明星初创Prime Intellect的机器学习研究员一则惊天爆料,彻底点燃了AI圈。 就连WSJ几天前的独家报道,也被人们翻了出来。
大模型再现黑马!英伟达开源Llama-Nemotron系列模型,效果优于DeepSeek-R1
近日,英伟达推出了 Llama-Nemotron 系列模型(基于 Meta AI 的 Llama 模型构建)—— 一个面向高效推理的大模型开放家族,具备卓越的推理能力、推理效率,并采用对企业友好的开放许可方式。 该系列包括三个模型规模:Nano(8B)、Super(49B)与 Ultra(253B),另有独立变体 UltraLong(8B,支持超长上下文)。 这些模型不仅具备超强的推理能力,还为企业使用提供开放许可。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
大型语言模型
生成式AI
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Transformer
Copilot
架构
MCP
编程
视觉