AI
苹果将开放AI模型给开发者,力求催生创新应用
苹果公司近日宣布,将向第三方开发者开放其人工智能模型,旨在激发新应用的创造力,并提升其设备的吸引力。 知情人士透露,这一计划将在6月9日的全球开发者大会(WWDC)上正式发布。 苹果希望通过提供软件开发工具包(SDK)和相关框架,让开发者能够基于其大型语言模型构建 AI 功能。
ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手
AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。 这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。 他表示,ChatGPT将从回答问题转变为为用户做事。
纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究
不再依赖语言,仅凭图像就能完成模型推理? 大模型又双叒叕迎来新SOTA! 当你和大模型一起玩超级玛丽时,复杂环境下你会根据画面在脑海里自动规划步骤,但LLMs还需要先转成文字攻略一格格按照指令移动,效率又低、信息也可能会丢失,那难道就没有一个可以跳过“语言中介”的方法吗?
瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊
京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊! 该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法。 它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%。
何恺明团队又发新作: MeanFlow单步图像生成SOTA,提升达50%
这段时间,大神何恺明真是接连不断地发布新研究。 这不,5 月 19 日,他又放出一篇新作! 论文标题:Mean Flows for One-step Generative Modeling 论文地址: MeanFlow 的单步生成建模框架,通过引入平均速度(average velocity)的概念来改进现有的流匹配方法,并在 ImageNet 256×256 数据集上取得了显著优于以往单步扩散 / 流模型的结果,FID 分数达到 3.43,且无需预训练、蒸馏或课程学习。
FaceAge登上「柳叶刀」!AI一张照片看穿你的真实年龄
你有没有发现,有些人看起来就是比其他人更老。 脸,不仅仅是我们的门面,还是一个人的「健康快照」,更是一张映射身体状态的「体检报告」。 最近的一项研究发现这其中还藏着更深的秘密,这项研究登上《柳叶刀数字健康》:Mass General Brigham团队用AI训练出一个模型FaceAge,从人脸照片里预测癌症患者的真实「生物年龄」以提供建议辅助治疗。
美图获阿里巴巴 2.5 亿美元投资,深度布局 AI 与电商领域
美图公司宣布与阿里巴巴签署了一项重大的战略投资协议,阿里巴巴将通过可转债形式向美图投资2.5亿美元。 这笔投资将为双方在电商平台、人工智能(AI)技术和云计算等多个领域的深度合作提供强大支持。 图源备注:图片由AI生成,图片授权服务商Midjourney根据协议,这项可转债的期限为三年,年利率为1%。
京东云宣布五大AI营销产品限时免费,助力商家提升销售效率
在最新的公告中,京东宣布将免费向其 POP 商家推出五大人工智能(AI)营销产品。 这一举措旨在帮助商家利用先进技术提升销售效果和运营效率。 这些新工具包括直播数字人、商家客服智能体、短视频生成工具、京点点以及京麦 AI 助手,均为商家提供了更为高效的营销手段。
Catena Labs获得1800万美元融资,打造AI原生金融机构
近日,人工智能初创公司 Catena Labs 在一份新闻稿中宣布,他们成功筹集了1800万美元的资金,旨在建设全球首个监管合规的 AI 原生金融机构,以支持 “代理经济” 的发展。 该公司由前 Circle 联合首席执行官肖恩・内维尔(Sean Neville)共同创办,他曾参与创建了 U SDC 稳定币。 本轮融资由知名风险投资公司 a16z Crypto 领投,参投方包括 Breyer Capital、Circle Ventures、Coinbase Ventures、CoinFund、Pillar VC、斯坦福工程风险基金等多个投资机构,以及包括 NFL 运动员汤姆・布雷迪、Twitch 联合创始人凯文・林和前 IBM 首席执行官山姆・帕尔米萨诺等知名天使投资人。
华硕CEO预测:AI电脑距离全面落地仍需两年
在台北举行的 Computex 展会上,华硕共同首席执行官胡镇荣(Samson Hu)表示,当前一波新型人工智能(AI)电脑的普及将需要到2026年甚至更久才能真正推动市场发展。 尽管去年的 AI 电脑发布引发了不少期待,但胡镇荣指出,市场前景并没有因此而显著改善,尤其是在当前全球经济形势不佳的背景下。 随着技术的不断进步,从华硕到联想等众多厂商都推出了 AI 电脑,希望能够为疲软的笔记本市场带来新的生机。
MarketWatch:谷歌加倍投入人工智能搜索,应对日益加剧的威胁
在近期举办的 I/O 开发者大会上,谷歌宣布将推出一系列新的人工智能(AI)功能,以巩固其在搜索引擎市场的领先地位。 随着 AI 技术的快速发展,尤其是来自 OpenAI 和 Perplexity 等新兴公司的竞争压力不断增大,谷歌似乎倍感压力。 因此,该公司推出了 “AI 模式”,这是其搜索引擎中 “最强大的 AI 搜索” 功能,具备更高级的推理和多模态能力。
谷歌NotebookLM视频概览重磅上线!PDF、图片秒变动画短片
谷歌在I/O2025大会上宣布,NotebookLM将推出全新视频概览(Video Overviews)功能,允许用户通过上传的PDF、图片、文本等来源素材,自动生成动画风格的短片,深入浅出地讲解复杂内容。 这一功能面向所有用户开放,首版仅支持英语,引发全球教育、科研和内容创作社区的热烈讨论。 AIbase综合最新社交媒体动态,深入解析视频概览的技术亮点及其对AI辅助学习与创作的深远影响。
DeepSeek发布大模型训练端到端论文,展示卓越工程深度
近日,DeepSeek发布了一篇关于大模型训练的最佳端到端技术论文,引发业界广泛关注。 该论文全面阐述了DeepSeek在大模型研发中的技术突破,涵盖软件、硬件及混合优化方案,展现了其令人惊叹的工程深度。 在**软件**层面,论文详细介绍了多头潜在注意力机制(MLA),显著降低推理过程中的内存占用;FP8混合精度训练通过低精度计算提升效率,同时保证数值稳定性;DeepEP通信库优化了专家并行(EP)通信,支持FP8低精度操作,加速MoE模型训练与推理;LogFMT对数浮点格式则通过均匀化激活分布,进一步优化计算效率。
苹果计划在 iOS 19 中向第三方开发者开放 AI 模型
根据彭博社记者马克・古尔曼的最新报道,苹果公司正在积极筹备在其即将发布的 iOS19中向第三方开发者开放其人工智能(AI)模型。 这一举措旨在促进软件开发,推动应用创新,并增强苹果自家硬件产品的吸引力。 据了解,苹果正在研发一套软件开发工具包(SDK)及相关框架,以便开发者能够利用 Apple Intelligence 所采用的大型语言模型来创建新功能。
每月249.99美元!谷歌推出 AI Ultra 订阅计划,畅享最强大 AI 模型与高级功能
谷歌宣布推出全新的 AI Ultra 订阅计划,旨在为用户提供最高级别的 AI 模型访问和丰富的高级功能。 随着人工智能技术的迅速发展,谷歌希望通过这一新计划,让更多用户能够利用其先进的 AI 能力来提升知识、创造力和工作效率。 AI Ultra 计划适合电影制作人、开发者、创意专业人士,或者任何追求最佳 AI 体验的用户,可以看作是进入谷歌 AI 世界的 “贵宾通行证”。
谷歌Gemma 3n发布!可在手机上流畅跑多模态AI,音频+图像+文本全能
谷歌在I/O2025大会上正式揭晓Gemma3n,一款专为低资源设备设计的多模态AI模型,仅需2GB RAM即可在手机、平板和笔记本电脑上流畅运行。 Gemma3n继承了Gemini Nano的架构,新增音频理解功能,支持文本、图像、视频和音频的实时处理,且无需云端连接,彻底颠覆了移动端AI体验。 AIbase综合最新社交媒体动态,深入解析Gemma3n的技术亮点及其对AI生态的影响。
谷歌Gemini 2.5 Pro Deep Think发布:并行推理重塑AI复杂问题解决
在2025年5月20日的Google I/O开发者大会上,谷歌DeepMind正式推出了Gemini2.5Pro Deep Think模式,这一实验性增强推理模式为AI处理复杂任务树立了新标杆。 Deep Think模式通过并行推理技术,使Gemini2.5Pro在数学、编码和多模态推理等领域的表现达到行业领先水平。 并行推理技术,显著提升复杂任务表现Deep Think模式采用前沿的并行推理技术,允许模型在生成响应前探索多个假设路径,从而提升答案的准确性和深度。
谷歌搜索AI模式正式上线,引入Deep Search功能
在2025年5月20日的Google I/O开发者大会上,谷歌宣布其**AI Mode(AI模式)**搜索功能正式在美国向所有用户开放,标志着传统搜索体验的重大转型。 AI模式由Gemini2.0模型驱动,结合了多模态推理、深度搜索和个性化功能,旨在为用户提供更智能、对话式的搜索体验。 对话式搜索与多模态支持AI模式突破了传统搜索的“十个蓝链接”模式,采用类似聊天机器人的交互方式。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
大型语言模型
生成式AI
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Transformer
Copilot
架构
MCP
编程
视觉