应用
谷歌再破界限:Gemini 2.5 Pro实现6小时视频理解,AI视觉能力迈入新纪元
谷歌Gemini2.5Pro视频理解能力再升级,这款旗舰AI模型不仅支持长达6小时的视频分析,还拥有高达200万Token的超大上下文窗口,同时首次实现通过API直接解析YouTube链接。 官方数据显示,该模型在VideoMME基准测试中达到84.7%的准确率,与行业顶尖水平的85.2%仅有一线之差,彰显了其强劲实力。 这项突破性技术现已通过Google AI Studio向开发者开放体验。
谷歌推出面向 13 岁以下儿童Gemini AI聊天机器人
谷歌最近宣布,将推出其新的 Gemini 人工智能(AI)聊天机器人,专门面向13岁以下的儿童。 这个新产品将在未来一周内在美国和加拿大上线,预计今年晚些时候也会在澳大利亚推出。 值得注意的是,这款聊天机器人将仅通过谷歌的家庭链接账户提供,这意味着家长可以对儿童的使用进行一定的控制。
Cursor 0.50版本重磅更新,简化定价与增强AI编程体验
Cursor于2025年5月9日推出0.50版本重大更新,带来了简化的定价模式、全面升级的Max模式以及一系列功能增强()。 此次更新聚焦于提升AI编程效率,新增跨文件代码建议、后台代理和多代码库支持等功能,进一步巩固了Cursor作为AI驱动代码编辑器的领先地位。 AIbase观察到,开发者社区对新版本的响应速度和多任务处理能力给予高度评价。
自变量机器人完成数亿元 A 轮融资,由美团战投领投
公众号《智能涌现》今日发文,具身智能公司「自变量机器人」近日完成数亿元 A 轮融资,由美团战投领投、美团龙珠跟投。该文自变量机器人被官方转发。
2025 年度十大 IP 揭晓,DeepSeek App等作品入选
由中国版权协会与中国文化娱乐行业协会指导的 “2025 世界 IP 经济发展大会暨全球 IP 授权博览会” 在广州成功举行。 本次博览会吸引了众多专家和业内人士的关注,最终评选出了 2025 年度十大 IP 和多个细分领域的 TOP10 名单。 此次评选共计有 2368 个参赛 IP 参与角逐,经过专家评审和网络投票的双重筛选,最终确定了十个优秀作品。
Claude AI API 引入全新的网页搜索功能
在人工智能领域备受瞩目的公司 Anthropic宣布为其 Claude AI API 引入全新的网页搜索功能。 这一创新标志着 Claude AI 能够实时访问网络信息,从而提升其回答问题的准确性,并为传统搜索引擎如谷歌带来了新的竞争压力。 开发者现在可以在发送请求时启用 Claude 的网页搜索工具。
亚马逊推出 “火神” 机器人,仓库工人的新机遇与挑战
最近,亚马逊在这一领域展示了其最新成果:一种新型 “能感知” 的 “火神” 机器人,正在取代部分仓库工人的工作。 亚马逊首席执行官安迪・雅西在社交媒体上表示,这款 “火神” 机器人通过处理符合人体工程学的任务,能够提高工作安全性,并为员工提供了提升技能的机会。 根据亚马逊的博客文章,火神机器人可以协助人类从仓库的高处和低处获取物品,这样一来,工人们就不必再频繁攀爬梯子或弯腰劳作。
Anthropic推出Claude API网页搜索功能,挑战谷歌搜索
近日,知名 AI 公司 Anthropic 在本月8日宣布,为其 Claude API 引入网页搜索功能,这一举动无疑为以谷歌为首的传统搜索引擎带来了新的挑战。 随着 Claude AI 能够访问最新的网络信息,开发者们可以利用这一功能构建更智能、更具实时性的应用程序,满足用户对最新信息的需求。 通过启用网络搜索工具,开发者在向 Claude 发送请求时,可以获取到现实世界中的最新数据。
马斯克透露 Grok 3.5 尚需优化,预计下周发布
近日,埃隆・马斯克在社交平台 X 上回答了一位网友的提问,谈及他最新的人工智能项目 ——Grok3.5。 该网友询问了 Grok3.5、GPT-03Pro 以及即将发布的游戏 GTA6哪个会先上线。 对此,马斯克坦言:“Grok3.5仍然有些粗糙,预计还需要一周左右的时间进行打磨。
首个智能文档处理基准发布:Gemini领跑但短板待补,多模态AI面临现实挑战
5月11日,智能文档处理领域迎来重大进展——首个针对视觉-语言模型的统一基准测试"IDP Leaderboard"正式推出。 该基准通过16个数据集、9229份文档,全面评估了当前主流模型在OCR、关键信息提取、视觉问答、表格提取、分类和长文档处理六大核心任务上的表现,为行业发展提供了可量化参考。 测试结果显示,Gemini2.5Flash在综合实力上力压群雄,但却在OCR和分类任务中出现意外"滑铁卢",表现甚至不如上一代的Gemini2.0Flash,分别下降了1.84%和0.05%。
快手推出 AI 作图工具 Poify,聚焦电商市场
近日,快手正式推出其新型 AI 作图工具 Poify,旨在为电商领域提供更加高效和经济的图像处理解决方案。 与现有的可灵 AI 相比,Poify 在功能上更加专注于 AI 作图,尤其是在电商相关的应用上。 Poify 的核心功能包括文生图和图生图,同时特别针对电商需求推出了一系列创新的 AI 作图能力。
谷歌搜索再迎新挑战:Anthropic 为其 API 引入网页搜索功能
Anthropic Claude API 可根据推理能力判断使用网络搜索是否有助于提供更准确的答案,还支持渐进式搜索功能。
马斯克:Grok 3.5“仍太粗糙”,需一周左右打磨
有网友日前提问“Grok 3.5、GPT-o3 Pro 和 GTA 6 哪个会最先发布?”对此,埃隆・马斯克的 X 账号回复称:“3.5 还是有点太粗糙了。还需要一周左右的时间。”
噱头大于实用?深度测评3款人气超高的AI智能体产品
关于 Manus 这类产品,我想说.... 从 Manus 发布至今,围绕着这类通用型智能体的讨论从没停过。 如今,在舆情平息的时候,我们觉得是时候好好评价一下这类产品了。
Midjourney又更新了!一个指令带你100%实现场景穿越!
大家好,还记得 Midjourney 之前说要 60 天高频更新吗? 他们还真没吹牛! 最近更新很频繁!
OpenAI ChatGPT 更新后过度讨好用户,两周过去问题仍未解决
OpenAI更新ChatGPT-4o后,AI表现出过度讨好用户的行为,甚至对荒谬想法也大加赞赏。CEO奥尔特曼撤回更新,但问题仍未解决。专家指出,AI的奉承倾向源于训练机制,可能引发社会问题。#AI伦理##ChatGPT#
淘宝推出桌面版客户端 支持 AI 购物功能
近日,淘宝在客户端领域有了新动作,已悄悄上线一款“桌面版”客户端。 不过,目前该客户端暂时仅提供Windows版本。 从官方发布的图片来看,这款“桌面版”客户端整体布局采用了网页浏览器风格。
曝国行版iOS18.6启用部分苹果AI 百度阿里提供技术支持
近日,苹果记者Mark Gurman爆料称,国行版苹果iOS18.6即将启用部分Apple Intelligence功能,而这一功能的实现将由百度和阿里共同提供技术支持。 据了解,在此次合作中,阿里负责开发审查引擎。 与此同时,百度将自身AI技术与苹果的Siri和Visual Intelligence进行深度整合。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉