应用
AI 拍“大片”:谷歌发布电影创作应用 Flow,脚本、分镜、镜头控制都能做
Flow 还内置了一整套视频制作工具,用户不仅能控制“摄像机”运动轨迹、调整拍摄角度,还能编辑与延展镜头,并为 AI 视频添加多种转场效果。
5/21/2025 2:11:49 AM
清源
谷歌搜索全新 AI 模式亮相:Gemini 2.5、个性化回答、深度搜索等
谷歌今日官宣,谷歌搜索正式迎来 AI 模式,该功能从今日起逐步在美国市场推出。
5/21/2025 2:03:52 AM
汪淼
谷歌 Gemini 2.5 Flash 轻量级模型官宣 6 月到来,2.5 Pro 随后将至
Gemini 2.5 系列模型将获得一项新的文本转语音功能,听起来更自然,甚至可以做到像耳语一样。它还可以使用同一种声音在不同的语言之间切换。
5/21/2025 1:44:40 AM
汪淼
谷歌 Project Mariner 公布,AI 智能体将全面上线 Chrome、搜索、Gemini
该项目此前命名为 Jarvis(贾维斯),在去年年底进行过测试,如今迎来新的进展。
5/21/2025 1:31:15 AM
汪淼
谷歌 Meet 视频会议平台将上线 Gemini“AI 同传”,可还原声音、语气、情感
在今日的 I/O 大会上,谷歌宣布将语音翻译功能引入 Meet视频会议平台。该技术借助 Gemini 人工智能,可将用户语音实时翻译成对方所使用的语言。
5/21/2025 1:22:12 AM
清源
蚂蚁武威:下一代「推理」模型范式大猜想
R1 之后,长思维链成为研究下一代基础模型中 “推理”(Reasoning)能力的热门方向。 一方面,R1 证明了大模型深度思考的可行性;与此同时,尽管 R1 展现出了强大的性能,大模型推理的序幕实则才刚刚拉开。 此外,R1 在海外掀桌也给国内人工智能的研究带来一个显著影响,即:越来越多的研究者敢于站在更高视角思考,提出前瞻引领的技术思想。
5/21/2025 12:10:00 AM
陈彩娴
英伟达推出人形机器人新模型,助力工业革命新篇章
英伟达首席执行官黄仁勋宣布推出最新的人形机器人基础模型 ——Isaac GR00T N1.5。 此次发布标志着英伟达在机器人开发基础设施上迈出了重要的一步,黄仁勋表示,这一模型将成为 “下一代工业革命的核心构建模块”。 GR00T N1.5模型的一个显著优势是其训练效率的显著提升。
5/20/2025 6:00:45 PM
AI在线
谷歌Imagen 4与Imagen 4 Fast亮相GCP Vertex配额菜单,AI图像生成迈向新高度
谷歌云平台(GCP)Vertex AI的配额下拉菜单中新增了Imagen4和Imagen4Fast选项,预示着这两款下一代AI图像生成模型即将迎来更广泛的推广。 继Imagen3的成功后,Imagen4系列以更强大的多模态生成能力和低延迟特性,为开发者与企业用户带来了前所未有的视觉创作体验。 AIbase综合最新社交媒体动态,深入解析Imagen4的技术亮点及其对AI图像生成领域的深远影响。
5/20/2025 6:00:45 PM
AI在线
谷歌 DeepMind 通过强化学习微调提升 AI 决策能力
近期,谷歌 DeepMind 团队与约翰・开普勒林茨大学 LIT AI 实验室合作,开展了一项关于人工智能语言模型的新研究。 他们采用了强化学习微调(RLFT)技术,旨在提升语言模型的决策能力。 这项研究的重点在于,通过思维链的强化训练,解决了模型在决策过程中存在的一些关键问题。
5/20/2025 6:00:45 PM
AI在线
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
Flowith正式发布Agent NEO,号称全球首个支持无限步骤、无限上下文、无限工具的AI智能代理。 这款由10人小团队在云南Vibe Hackathon中诞生的创新产品,凭借其强大的云端执行能力和多模态协作功能,迅速引发全球开发者社区的热议。 AIbase综合最新社交媒体动态,深入解析Agent NEO的技术突破及其对AI生产力工具领域的深远影响。
5/20/2025 5:00:45 PM
AI在线
Public “Generated Assets”重磅上线!AI一键生成投资指数
投资平台Public宣布推出全新AI驱动产品“Generated Assets”,允许用户通过简单文本输入投资理念,即可生成定制化的投资指数,并提供历史回报对比和实时表现跟踪。 这一功能因其类似“氛围投资”的创新模式引发热议,被认为是零售投资领域的重大突破。 AIbase综合最新社交媒体动态,深入解析Generated Assets的技术亮点及其对投资市场的深远影响。
5/20/2025 4:00:45 PM
AI在线
浙江:将智能家居机器人、智能眼镜等产品纳入消费品以旧换新补贴范围,最高 2000 元 / 件
浙江省政府印发《关于支持人工智能创新发展的若干措施》,自2025年5月31日起实施。新政重点支持具身智能应用,建设行业基地,开放应用场景,并将智能家居机器人等纳入以旧换新补贴范围,最高补贴2000元。#浙江AI新政##具身智能#
5/20/2025 3:16:11 PM
远洋
富士康与英伟达携手打造100兆瓦人工智能数据中心
在全球最大的合约电子产品制造商富士康(Foxconn)与知名芯片制造商英伟达(Nvidia)之间,合作的脚步愈发坚定。 近日,富士康在台北国际电脑展上宣布,将分阶段建设一座专门针对人工智能(AI)应用的数据中心,预计其总功率将达到100兆瓦(MW)。 富士康董事长刘扬伟在展会上透露,该人工智能数据中心将采取逐步建设的方式。
5/20/2025 3:00:45 PM
AI在线
微软宣布Windows11原生支持MCP
微软宣布对 Windows 系统进行重大升级,以支持一种名为模型上下文协议(MCP)的新标准。 这一标准由 Anthropic 于去年推出,常被称为 “AI 应用的 USB-C 端口”。 MCP 的引入,将使得开发者能够更加便捷地让他们的 AI 应用与其他应用、网络服务及 Windows 的各个部分进行互动。
5/20/2025 3:00:45 PM
AI在线
谷歌推出 NotebookLM 移动应用,可生成智能总结、音频播客
谷歌正式推出NotebookLM移动应用,AI笔记助手登陆安卓和iOS。支持智能总结、提问解答、音频概览等功能,还能自动切换深浅色模式。#谷歌IO# #AI助手#
5/20/2025 3:00:37 PM
远洋
微软将开源 GitHub Copilot Chat 扩展,推动 VS Code 成开源 AI 编辑器
微软昨日(5 月 19 日)发布博文,宣布开源 GitHub Copilot Chat 扩展的代码,并将其核心功能整合到 Visual Studio Code 中,并推动 VS Code 向开源 AI 编辑器转型。
5/20/2025 2:43:12 PM
故渊
美团AI编程工具“NoCode”即将上线,对话式开发工具对标Lovable
据智能涌现消息,美团正在加速其AI战略布局,即将推出一款名为“NoCode”的AI编程工具,并已悄然注册了“nocode.cn”域名,目前该网站正处于灰度测试阶段,预示这款面向非技术用户的全新产品即将正式面世。 该工具由美团研发质量与效率团队打造,定位于新兴的“Vibe Coding(氛围编程)”赛道,通过对话式交互实现应用构建,主打“人人可用”的AI编程体验。 不同于Cursor这类以开发者为中心的辅助编程工具,也区别于Devin所代表的AI自主编程路径,美团的“NoCode”更接近于近期在行业内受到关注的Lovable产品,面向非程序员用户,强调通过自然语言多轮对话完成代码生成、部署和修改。
5/20/2025 2:00:55 PM
AI在线
谷歌 DeepMind 新研究强化思维链训练,让 AI 语言模型不再“纸上谈兵”
科技媒体 marktechpost 昨日(5 月 19 日)发布博文,报道称谷歌 DeepMind 团队联合约翰・开普勒林茨大学 LIT AI 实验室,通过强化学习微调(RLFT)技术,提升语言模型的决策能力。
5/20/2025 1:54:43 PM
故渊
资讯热榜
Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
Meta刚刚开源DINOv3,横扫60+任务,无标注封神!
扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
Nvidia 投资 5 亿美元,Cohere 公司估值达 68 亿美元
ChatGPT或将引入广告!OpenAI高管首度松口,用户破7亿仍难盈利
破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控
OpenAI华人露头就被小扎挖!95后北大校友1个月前上直播,今天已是Meta人
2025年AI工具大盘点!这6款神器让你的效率提升3倍!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
AI新词
生成式
Claude
苹果
Agent
神经网络
AI for Science
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
AGI
视频生成
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全