应用
OpenAI 推出“实时 API”:让AI语音助手像真人一样沟通
OpenAI 正式发布了其面向生产环境的“实时 API”,标志着公司在语音交互技术领域迈出了重要一步。 该 API 主要面向为客户支持、教育或个人生产力等实际应用构建语音助手的公司和开发者,其核心组件是全新的 GPT-Realtime 模型。 该模型能够直接生成和处理语音,无需传统的文本转换步骤,从而实现更快、更自然的对话。
Anthropic 重大隐私政策更新:用户数据将用于模型训练,需在9月28日前选择退出
Anthropic 正在对其用户数据处理方式进行重大调整。 该公司宣布,从即日起,所有 Claude 用户必须在9月28日之前决定是否将其对话用于训练 AI 模型。 此前,Anthropic 曾承诺不使用消费者的聊天数据进行模型训练,并会在30天后自动删除用户提示和对话输出。
Anthropic报告警示:AI 技术助力网络犯罪新趋势
近日,人工智能公司Anthropic发布了一份最新的网络威胁情报报告,指出黑客、诈骗者和国家支持的组织正越来越多地利用其开发的 Claude 聊天机器人进行复杂的网络攻击。 报告中详细列举了这些犯罪分子如何通过 AI 技术实现数据盗窃、敲诈勒索、虚假就业和勒索软件的开发,为网络安全防护带来了新挑战。 图源备注:图片由AI生成,图片授权服务商Midjourney报告中提到的一个严重案例是代号为 GTG-2002的网络犯罪行动。
百度未来五年计划培养 1000 万 AI 人才
近日,国务院常务会议审议通过了《关于深入实施 “人工智能 ” 行动的意见》,为中国人工智能技术与产业的深度融合以及规模化商业应用指明了方向。 百度副总裁石清华表示,《意见》的出台标志着中国在人工智能领域迈入全面融合、深化应用的新阶段。 作为国内领先的人工智能公司,百度在过去十年中已累计投入超过1800亿元人民币用于研发。
微软推出首批自主研发 AI 模型:挑战 OpenAI,赋能下一代 Copilot
微软人工智能部门于周四发布了首批自主研发的 AI 模型:MAI-Voice-1AI 和 MAI-1-preview。 此举标志着微软在自研 AI 模型领域迈出重要一步,有望改变其对外部模型的依赖,并为未来的 Copilot 产品奠定基础。 MAI-Voice-1:极速语音生成新突破MAI-Voice-1是一个专注于语音生成的模型,其最大亮点是高效和低成本。
深度测评!谷歌全新AI模型Nano Banana(附30+提示词案例)
大家好,我是言川。 最近,一款名为 Nano banana 的神秘图像编辑模型火爆全网,昨晚熬了通宵测试了 100 案例,得出一个结论:它就是目前最强的图像编辑模型,完美解决了 Flux Kontext、GPT-4o 对主体局部修改出现的变形问题。 往期报道:直接上案例,为了测试主体一致性效果,我先用 Midjourney 生成了一张电影风格的角色分镜图。
顶级邪修倾囊相授!8个案例教你速通Nano Banana
大家好,这里是歸藏(guizang),今天教大家如何最大程度发掘最强图片编辑模型 Nano Banana 的潜力。 往期报道:昨晚我们期盼了很久的图像编辑模型终于上线了,大家不再需要从竞技场吭哧瘪肚抽卡,可以爽玩,而且谷歌一如既往的发挥了财大气粗的优势,可以让你疯狂白嫖。 在做了一晚上的通宵测试之后,发现这玩意真的很离谱。
重磅消息回顾!2025年8月值得关注的8条AI资讯
更多资讯报道:一、OpenAI重新上线GPT-4o. 8月10日,OpenAI 近期推出的 GPT-5 引发轩然大波,上线后便因诸多问题遭到用户强烈吐槽,不少人呼吁重新启用旧版 GPT-4o。 面对如潮差评 OpenAI 首席执行官萨姆·奥尔特曼迅速回应,承认低估了用户对 GPT-4o 的喜爱程度。
SuperCLUE多模态视觉评测榜:文心4.5 Turbo总分并列国内第一
8月28日,中文多模态视觉语言模型测评基准(SuperCLUE-VLM)8月榜单正式发布,百度ERNIE-4.5-Turbo-VL多模态大模型以 66.47分 的成绩并列位居国内模型第一,在真实场景任务下的领先优势明显。 本次评估覆盖Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等国内外15款多模态模型。 基于中文场景特点,SuperCLUE-VLM围绕基础认知、视觉推理和视觉应用三大核心维度进行评测,全面考察模型在真实任务场景下的能力。
谷歌又赢了,nano banana「被迫」改名后,网友搞出7种神仙玩法
世界上最好的AI图像编辑模型又易主了。 谷歌这次又赢麻了! 神秘图像编辑模型 nano banana 被谷歌认领、正式改名为 Gemini-2.5-flash-image 后,热度仍居高不下,火爆程度丝毫不亚于 GPT-4o 掀起的「吉卜力热潮」。
全新岚图知音正式上市,20.29万元起
今日,全新岚图知音于成都重磅上市。 新车共推出后驱乾崑版、四驱乾崑版、超长续航乾崑版三大版型,官方指导价为20.29万元至24.29万元。 为回馈首批下定用户,岚图特别准备了高达36,000元的专享首销权益。
面试8小时写 “Devin”,硅谷这家公司真把求职者逼到极限
在硅谷的一家公司,求职者的面试不再是简单的算法题,而是一个极具挑战性的 “创业模拟”。 Cognition 的 CEO Scott Wu 近日透露,面试流程要求应聘者在8小时内从零开始复刻出公司的一款 AI 产品,类似于 “Devin”。 这不仅测试技术能力,更是对抗压能力的极致考验。
78% 的企业重视网络能力以推动生成式人工智能部署
根据 IDC、NTT DATA 和思科联合发布的最新报告《网络:CIO 关于企业网络和人工智能的指南》,78% 以上的企业在选择生成式人工智能(GenAI)基础设施提供商时,将网络能力视为重要或非常重要的因素。 这一数据反映了企业在向人工智能驱动的数字化转型投资时的优先事项发生了显著变化。 图源备注:图片由AI生成,图片授权服务商Midjourney该报告基于对1209家组织的调查,指出人工智能驱动的网络技术正在改变网络管理方式,带来了先进的自动化、增强的安全性和优化的性能。
Beatoven.ai 推出全新音乐 AI 模型,确保艺术家获得持续收入
音乐科技初创公司 Beatoven.ai 近日推出了一个名为 Maestro 的全新生成式 AI 音乐基础模型。 此模型的特点在于,它通过与版权持有者的合作,确保了音乐创作的合法性,并为艺术家、作曲家和权利持有人提供持续的版税收入。 这一举措标志着音乐生成 AI 领域的一次重要进步,表明创新可以在尊重版权的前提下进行。
马来西亚芯片突破!SkyeChip发布该国首款边缘AI处理器,摆脱对美依赖迈出关键一步
东南亚AI芯片领域迎来历史性时刻! 马来西亚芯片设计公司SkyeChip在周一的行业活动上正式发布了该国首款自主研发的边缘AI处理器MARS1000,这一突破性成果标志着马来西亚在全球AI竞赛中迈出了重要的一步。 AIbase报道 据彭博社报道,虽然边缘处理器的性能无法与英伟达的先进芯片相提并论,但对于正在寻求在全球AI竞争中发挥更大作用的马来西亚而言,MARS1000 处理器的发布仍然具有里程碑式的技术意义。
AI教育的“百亿补贴”来了!阿里夸克发布“教育计划”,对7000万师生免费
在国家大力推进"人工智能 "行动的战略背景下,阿里巴巴AI旗舰应用夸克在8月28日宣布推出面向全国近2000万教师和5000万高校学生的"教育计划":通过长期、稳定的免费权益与专属优惠,让师生低门槛使用AI工具。 目前,在职教师及大学生在夸克App上搜索“夸克教育计划”,完成身份认证(教师凭教师资格证,学生凭学信网信息)后,即可免费领取为期 3 个月的会员,涵盖“AI会员”“夸克网盘”“夸克扫描王”三大核心产品。 9 元一年的优惠价格续费,相当于原价的二十分之一。
来和数字员工「AI吴彦祖」聊聊天,百度智能云重磅升级百舸5.0、千帆4.0
“智能经济时代,一定要有新的基础设施来支撑,这就是智能优先的 AI 云。 ”8 月 28 日的 2025 百度云智大会上,百度集团执行副总裁、百度智能云事业群总裁沈抖给出了云厂商在 AI 原生时代的新定位。 从个人调用 AI 聊天、独立开发者使用 AI 打造 “一人公司”,到企业借力 AI 重构传统业务,不同用户群体共同催生了 AI 云需求的大爆发。
元石科技正式发布问小白5,性能直追GPT-5
本月初,AI 圈翘首以盼的 GPT-5 终于问世,在数学、实际编程、多模态理解、推理等多个领域实现了新的 SOTA。 与此同时,国内厂商也在全力加速,持续迭代自研模型与技术栈,力求在全球竞逐中不落下风。 今日,国产 AI 厂商元石科技重磅推出「All in One」旗舰模型 —— 问小白 5,成为其迄今为止最智能、最快捷、最实用的 AI 系统。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉