应用
谷歌考虑与安卓制造商签署Gemini人工智能独家合作协议
在最近的一场反垄断审判中,曝光出谷歌的内部文件显示,该公司曾在去年考虑与多个安卓手机制造商,如三星等,达成独家合作协议。 这些协议不仅涉及谷歌的搜索应用程序,还包括其最新推出的 Gemini 人工智能应用和 Chrome 浏览器。 这一消息无疑引发了行业的广泛关注,尤其是在当前反垄断监管日益严格的背景下。
密码管理公司1Password 推出新功能,助力 AI 代理安全管理企业凭证
随着人工智能(AI)逐渐接管传统上由人类负责的商业流程,许多 AI 代理将需要安全地登录多个系统,以完成它们的任务。 为了解决企业在现代凭证管理中面临的挑战,知名密码管理公司1Password 宣布,已在其扩展访问管理平台(XAM)上新增了 AI 代理安全功能。 图源备注:图片由AI生成,图片授权服务商Midjourney近年来,AI 技术的迅猛发展引发了人们对于未来就业市场的讨论。
OpenAI 高管在庭审中透露:若谷歌被迫出售 Chrome,将考虑收购
在最近于华盛顿举行的谷歌反垄断庭审上,OpenAI 高管 Nick Turley 引发了广泛关注。 他表示,如果法院裁定谷歌必须出售其 Chrome 浏览器以恢复搜索市场的竞争,OpenAI 将有意收购这一浏览器。 此次庭审是因法官在2024年裁定谷歌在在线搜索及相关广告市场具有垄断地位而引发的,尽管谷歌表示计划上诉,但庭审却揭示了生成式人工智能领域内的激烈竞争。
两名本科生打造 AI 语音模型,挑战谷歌 NotebookLM
在 AI 语音生成领域,竞争正变得愈发激烈。 近日,来自韩国的两名本科生合伙创建了一款名为 Dia 的 AI 语音模型,声称其功能可与谷歌的 NotebookLM 相媲美。 尽管这两位创始人在 AI 领域的经验尚浅,但他们在短短三个月内,成功开发出一款开放获取的语音生成工具。
强化学习之于 AI Agent,是灵魂、还是包袱?
自主决策能力是 Agent 受到重视,并被称为 AI 时代“新基建”原因。 从这个角度看,Workflow 似乎做不出真正的通用 Agent。 而要谈真正具备决策能力和自我意识的 Agent,其实要从 AlphaGo 的问世说起。
Agent 要被吃进大模型了
今天凌晨,奥特曼突然发文宣布推出自家最新的 o 系列模型:满血版 o3 和 o4-mini,同时表示这两款模型都可以自由调用 ChatGPT 里的各种工具,包括但不限于图像生成、图像分析、文件解释、网络搜索、Python。 总的来说,就是比前一代的性能更强而且价格更低。 消息一出,马上就有网友晒出了两个模型的“小球测试”结果,并配文:“这确实是迄今为止看到的最好的测试结果了。
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
昨天一早,Meta 了放出自家用了 20 万显卡集群训练出的 Llama 4 系列模型,其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。 消息一出,直接引爆了大模型圈。 Meta 还特意强调,这些模型都经过了大量未标注的文本、图像和视频数据的训练,视觉理解能力已经到了 Next level,有种在大模型领域一骑绝尘的既视感。
Character.AI 推出 AvatarFX 模型:让静态图片中的人物“开口说话”
Character.AI 近日宣布推出全新视频生成模型 AvatarFX,这一突破性技术能够将静态图片转化为具有真实感的可说话视频角色,赋予图像中的人物动态表情、唇部同步以及自然肢体动作。 AvatarFX 的核心是其最先进的基于扩散模型的动态生成技术。 该技术依托经过精心筛选的数据集进行训练,融合了创新的音频条件化、蒸馏和推理策略,使得用户能够以极高的速度生成高保真、时间一致性强的视频。
司法部或迫使谷歌出售 Chrome,OpenAI 表明收购意愿
据路透社报道,在谷歌垄断案的救济措施审理阶段,OpenAI 的 ChatGPT 产品负责人今日向法官表示,如果谷歌被迫出售 Chrome 浏览器,OpenAI 有兴趣收购。 美国司法部在“美国诉谷歌”案中提出强制谷歌剥离 Chrome 浏览器的救济措施。 此前,法官阿米特·梅塔已裁定谷歌在在线搜索领域构成垄断。
Genspark AI幻灯片工具发布,革新专业演示文稿创作
Genspark推出全新AI幻灯片工具,旨在通过人工智能简化专业演示文稿的创作流程。 据AIbase了解,该工具能够快速整合复杂多格式数据、自动生成综合报告,并支持交互式修改与多样化艺术风格,显著提升演示文稿的质量与效率。 Genspark的这一创新已在开发者与企业用户中引发热烈反响,项目详情通过Genspark官网与GitHub公开。
Nvidia 将首次在美国制造 AI 超级计算机,打造自主供应链
Nvidia 近期宣布,将在美国本土首次制造其 AI 超级计算机。 这一举措标志着该公司与一系列制造合作伙伴共同合作,旨在在美国工厂内建造、包装、测试和组装下一代 Blackwell 系统。 目前,Blackwell 芯片的生产已经在位于亚利桑那州的 TSMC 半导体制造厂展开,而超级计算机的组装则将在德克萨斯州进行,由富士康在休斯顿和纬创在达拉斯进行扩展。
Gartner报告:2027年,任务特定AI使用频率将是通用AI的三倍
根据最新发布的 Gartner 报告,到2027年,企业将使用任务特定的人工智能模型的频率将是通用大语言模型的三倍。 报告指出,尽管通用大语言模型在语言处理方面具备强大的能力,但在需要深入理解特定业务领域的任务时,它们的响应准确性会下降。 因此,越来越多的企业开始关注能够满足特定需求的定制化模型。
告别 AI 数据盲区!Relyance AI 新平台实现端到端流向可视化
数据治理平台提供商 Relyance AI 在去年10月获得3210万美元 B 轮融资后,推出了全新的 Data Journeys 平台,旨在解决企业采用 AI 时面临的关键挑战:准确了解数据在复杂系统中的流转。 该平台能够追踪数据在应用程序、云服务和第三方系统中的使用方式和原因,填补了传统数据沿袭方法的空白。 Relyance AI 首席执行官兼联合创始人 Abhi Sharma 强调,Data Journeys 提供了 AI 原生的、情境感知的数据全生命周期视图,从原始数据收集到每次转换和用例都清晰可见。
Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话
Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。
Manus开源平替!Kortix-AI正式发布开源通用AI智能体平台Suna
Kortix-AI正式发布开源通用AI智能体平台Suna,定位为热门AI工具Manus的开源替代品。 据AIbase了解,Suna集成了浏览器自动化、文件管理、网络爬虫、扩展搜索、命令行执行、网站部署及API集成等功能,通过自然语言对话实现复杂任务的自动化处理。 项目已在GitHub上线,凭借其强大的功能集与开源特性,迅速成为AI开发者和自动化爱好者的关注焦点。
Grok大更新!视觉能力、多语言音频处理与实时搜索功能震撼上线
由xAI打造的生成式人工智能聊天机器人Grok迎来了一次里程碑式的更新,其功能全面升级,不仅新增了视觉处理能力,还实现了多语言音频处理以及语音模式下的实时搜索功能。 这一更新标志着Grok在多模态AI领域的重大突破,为用户提供了更智能、更便捷的交互体验。 以下,AIbase将为您详细解析此次更新的亮点与意义。
苹果 Siri 团队大换血:AI 浪潮下,新负责人能否力挽狂澜?
彭博社今天(4 月 23 日)发布博文,报道称苹果新任 Siri 工程负责人 Mike Rockwell 正在对语音助手 Siri 的开发管理团队进行大刀阔斧的改革。
7个AI视频照明样式提示词+效果展示
在AI视频创作中,精准的照明样式是提升作品质感的关键。 本文系统解析7种专业级照明样式提示词,结合视觉效果对比,为创作者提供直观的应用指南。 上期回顾:.
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉