应用
AI 模型隐瞒推理过程引发担忧,研究称其 “思考” 常常不可信
在教育中,我们常常被教导要 “展示你的思考过程”,而现在一些高端的 AI 模型声称能够做到这一点。 然而,最新的研究却表明,这些模型有时会隐藏真实的推理过程,反而编造出复杂的解释。 来自 Anthropic 的研究团队近期对模拟推理(SR)模型进行了深入研究,包括其自家开发的 Claude 系列和 DeepSeek 的 R1模型,发现这些模型在展示其 “思考” 时,常常不透露它们所依赖的外部信息或使用的捷径。
4/13/2025 7:34:47 AM
AI在线
英格兰银行警告:生成式AI可能加剧股市波动与操控风险
股市本就充满不确定性,如今英格兰银行发出了警告:生成式人工智能的应用可能会进一步放大市场波动,甚至带来股市操控的风险。 根据该银行金融政策委员会发布的一份报告,随着AI技术在金融市场的广泛采用,市场可能会趋向单一化,并由此带来“羊群效应”,使得股市波动更加难以预测。 英格兰银行担忧,随着自主机器人不断学习市场波动的规律,它们可能意识到,通过在波动中进行交易可以带来利润。
4/13/2025 7:34:47 AM
AI在线
傅利叶推出首款开源人形机器人 Fourier N1,推动机器人技术创新
通用机器人公司傅利叶正式发布了其首款开源人形机器人 ——Fourier N1。 此次发布标志着傅利叶 “Nexus 开源生态矩阵” 项目的落地,Fourier N1不仅在硬件设计上采用了创新的构造,还同步开放了涵盖物料清单、设计图纸、装配指南和基础操作软件在内的完整资源包,以便于全球的开发者进行研究和开发。 Fourier N1的身高为1.3米,重量为38公斤,拥有23个自由度的关节设计,使其在运动灵活性和功能性上表现优异。
4/13/2025 7:34:47 AM
AI在线
Digital Promise推出AI产品认证计划 保障教育技术工具的安全与公正
近日,非营利组织数字承诺(Digital Promise)宣布推出 “负责任设计的 AI 产品认证” 计划,旨在帮助学校领导选择符合学生学习与安全要求的人工智能驱动教育技术工具。 随着 AI 在教育领域的迅速发展,学校面临着越来越多的选择,如何挑选出安全且有效的工具成为了一个重要课题。 该认证项目特别针对人工智能教育工具的多个关键方面进行评估,包括数据安全性、公平性以及透明度。
4/13/2025 7:34:46 AM
AI在线
魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令
大模型驱动的 AI 助手又升级了。 本周五,科技圈正在围观一个陪你一起玩《我的世界》的 AI。 它话不多说,就是埋头干活。
4/12/2025 4:02:00 PM
机器之心
算法不重要,AI的下一个范式突破,「解锁」新数据源才是关键
众所周知,人工智能在过去十五年里取得了令人难以置信的进步,尤其是在最近五年。 回顾一下人工智能的「四大发明」吧:深度神经网络→Transformer 语言模型→RLHF→推理,基本概括了 AI 领域发生的一切。 我们有了深度神经网络(主要是图像识别系统),然后是文本分类器,然后是聊天机器人,现在我们又有了推理模型。
4/12/2025 3:57:00 PM
机器之心
英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1 模型,推动 AI 高效部署
英伟达发布 Llama-3.1-Nemotron-Ultra-253B-v1,这款 2530 亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。
4/12/2025 1:55:25 PM
故渊
字节跳动推出 VAPO 框架:突破 AI 推理极限,Qwen2.5-32B 提分 12 倍超 Deepseek-R1
字节跳动Seed团队推出VAPO强化学习框架,针对大型语言模型在复杂任务中的推理能力进行优化。VAPO通过三项创新技术,显著提升模型性能,在AIME24基准测试中得分从5分跃升至60.4分。#AI技术# #字节跳动#
4/12/2025 1:46:13 PM
故渊
数月 → 几天:OpenAI 被曝缩水模型安全测试,AI 竞赛埋下隐患
金融时报(FT)昨日(4 月 11 日)发布博文,报道称 OpenAI 大幅压缩最新大型语言模型(LLM)安全测试时间,此前需要数月时间,而最新 o3 模型仅有几天时间。
4/12/2025 12:44:01 PM
故渊
谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索
谷歌Gemini AI新功能Circle Screen曝光,用户可圈选屏幕特定区域实现精准搜索,提升交互体验。类似安卓旗舰机的Circle to Search功能,但更聚焦于某一对象。#谷歌Gemini##AI新功能#
4/12/2025 8:45:30 AM
故渊
如何用AI做好情感化设计?来看大厂的实战案例!
近期金融业务完成了反馈态和空状态改版,用 AI 工具串联完成了从 IP 人格化文案到品牌视觉落地的完整链路。 过程中最深的体会是:AI 真正的价值不在于替代设计,而在于释放设计师对用户情绪管理的把控能力。 在借贷这类高敏感性场景中,一个加载动画的迟疑、一句提示文案的冰冷,都可能成为压垮用户信任的一根稻草。
4/12/2025 12:28:25 AM
团队58UXD
从算力设施到软件工具,华为云超节点引领全栈AI产品智能升级
4 月 10 日 - 11 日,华为云生态大会 2025 在安徽芜湖成功举行。 在第二天的华为云产品技术发布会上,华为云面向伙伴和客户发布了全新升级的昇腾 AI 云服务、软件开发生产线 CodeArts、数字内容生产线 MetaStudio、云原生安全体系、数据治理生产线 DataArts、GaussDB 数据库等产品及解决方案。 对于本次产品技术发布会,华为公司副总裁、中国云业务部部长张修征特别指出,华为云将在打造对等多元算力基础设施、做好昇腾 AI 云服务支持百模千态、以核心软件与工具链重塑应用、做好智能世界 “黑土地” 四大方面持续压强投入,解决 AI 落地时的算力、幻觉、数据、安全等复杂挑战,加速千行万业智能升级。
4/12/2025 12:27:00 AM
新闻助手
原生多模态大模型也能强化学习,思维链长达几万字,商汤日日新V6来了
如果让大模型像人一样聪明,应该是什么样的? 你可能会回答,我们生活的世界纷繁复杂,常常涉及多模态信息(如声音、文字、视觉、时间、空间等等),对大模型提出了极为复杂和严苛的挑战。 这要求大模型必须拥有极强的推理和交互能力。
4/11/2025 10:59:00 PM
机器之心
ChatGPT重大更新,能翻出所有历史对话,网友被AI聊破防了
今天凌晨,OpenAI 的 CEO 山姆・奥特曼突然发推说自己睡不着了,因为有重要新功能要推出。 很快,OpenAI 就正式发布了一个令人期待的新功能。 从今天开始,ChatGPT 在每次开启对话中都可以参考你过去的所有聊天记录,提供更加个性化的回复,并在建议中能够根据你的喜好和兴趣进行优化。
4/11/2025 10:52:00 PM
机器之心
OpenAI 宣布 ChatGPT 自 4 月 30 日起停用 GPT-4 模型,全面升级至 4o 版本
根据官方评估报告,GPT-4o 在写作质量、编程辅助、STEM 领域全面超越 GPT-4 模型,而且最近又进一步升级改善了 GPT-4o 的指令遵循、问题解决和对话流程。
4/11/2025 9:33:42 PM
问舟
2025 世界人工智能大会定档 7 月 26 日至 28 日在上海举办
2025 世界人工智能大会暨人工智能全球治理高级别会议将于 7 月 26 日至 28 日在上海世博中心和世博展览馆举办,本届大会主题为“智能时代同球共济”。
4/11/2025 8:48:15 PM
浩渺
消息称苹果计划今年秋季发布 Apple Intelligence Siri
据《纽约时报》报道,其苹果内部消息人士仍然对 Apple Intelligence Siri 秋季发布充满信心。
4/11/2025 8:17:43 PM
汪淼
华为张修征:今年上半年 CloudMatrix 384 超节点将有数万规模上线,有望“彻底终结算力焦虑”
华为公司副总裁张修征今日表示,华为云 CloudMatrix 384 超节点今年上半年将有数万规模的上线,这或将彻底终结算力焦虑。未来,CloudMatrix 超节点可以构建超过万片的大集群来提供算力。(科创板日报)
4/11/2025 7:45:57 PM
汪淼
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
模型
数据
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
Sora
3D
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind