资讯列表
OpenAI 升级 ChatGPT 语音模式,体验更自然对话
OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。 这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。 在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。
机械臂也能“接大模型”!Hugging Face LeRobot重磅开源,AI机器人研发门槛大降!
近日,Hugging Face推出的开源项目LeRobot引发了业界广泛关注。 这一项目通过整合最先进的机器学习算法和便捷的开发工具链,为开发者提供了一个高效、易用的机器人AI开发平台,堪称机器人领域的“Transformer时刻”。 统一接口,适配多款硬件LeRobot项目的一大亮点是其统一的硬件接口设计,能够无缝适配多种机器人硬件,包括机械臂、摄像头和电机等设备。
美国拟禁止州级人工智能法规,引发对消费者保护的担忧
最近,针对人工智能(AI)立法的争议在美国愈演愈烈。 国会的商业委员会共和党成员在最新版本的预算提案中,提出了一项为期十年的州级 AI 法规禁令。 这项提案源于前总统唐纳德・特朗普的一项大型预算计划。
高考数学大赛:六大AI模型争锋,豆包与元宝双双夺冠
随着高考的到来,数学考试再一次成为考生们心中的 “魔鬼”。 在这场竞争中,六大人工智能模型也参与了挑战,分别是字节的豆包、腾讯的元宝、阿里的通义、百度的文心 X1Turbo、深度求索的 DeepSeek 以及 OpenAI 的 o3。 此次测试采用的是2025年新课标 Ⅰ 卷的14道客观题,总分为73分,涵盖了单选题、多选题和填空题。
Clark 发布背后:Superblocks 公布19条系统提示,揭秘企业级 AI 编码逻辑
Superblocks 首席执行官布拉德·梅内泽斯(Brad Menezes)相信,下一个十亿美元级的 AI 创业灵感,藏在每个你看不见的“系统提示”中。 在近日发布其企业编码 AI 代理产品 Clark 时,这位初创公司创始人不仅带来了新产品,还主动开放了一个含有19个知名 AI 编码产品系统提示的文档,迅速在社交平台引爆关注。 这些系统提示来自 Windsurf、Manus、Cursor、Lovable、Bolt 等业内热门工具,首次将“系统提示工程”这一隐秘技术领域拉入公众视野。
ChatGPT 语音功能升级,实时翻译对话更自然流畅
最近,OpenAI 对其 ChatGPT 的语音功能进行了全面升级,特别是针对订阅用户,旨在提升 AI 的语音表达的自然性和情感丰富度。 根据 OpenAI 的说法,更新后的 “高级语音模式” 现在可以实现更流畅、情感更细腻的语音输出,包括对语调、停顿以及表达同理心或讽刺等情感的改进。 图源备注:图片由AI生成,图片授权服务商Midjourney值得注意的是,此次更新还新增了实时翻译功能。
苹果研究揭示AI“假性思考”真相:推理模型在复杂任务下反而崩溃
一项由苹果研究人员主导的新研究,对当前被寄予厚望的大型推理模型(LRM)泼了一盆冷水。 研究发现,在解决复杂任务时,像 Claude3.7Thinking 和 Deepseek-R1等专为“模拟思维过程”设计的推理模型,不仅未能展现出优势,反而出现“思考不足”、性能崩溃等严重问题。 这项研究测试了四种经典逻辑谜题:汉诺塔、跳棋、渡河与积木世界。
小红书发布首个开源大模型dots.llm1:11.2 万亿非合成数据助力中文性能提升
小红书近日宣布开源其首个大规模模型 ——dots.llm1,该模型具有1420亿个参数,是一种专家混合模型(MoE)。 其设计的一个显著特点是,在推理过程中仅激活140亿参数,这种结构不仅保持了高性能,还大幅降低了训练和推理的成本。 dots.llm1使用了11.2万亿个非合成的高质量训练数据,这在当前开源大模型中显得非常罕见,表明小红书在语言处理方面的强大资源。
iPhone神话动摇?苹果在AI竞赛中步履蹒跚,WWDC或成关键转折点
在全球生成式人工智能加速演进的背景下,苹果正面临一次“信任危机”。 尽管一年前高调预告将为 iPhone 带来一系列 AI 功能,尤其是 Siri 的智能升级,但截至目前,这些“Apple Intelligence”承诺大多尚未兑现。 而在谷歌、OpenAI、三星等竞争对手陆续发布 AI 手机与助手功能之际,苹果的沉默显得愈发被动。
欧洲AI黑马崛起:Mistral年营收或超1亿美元,拟融资10亿
法国人工智能初创公司 Mistral AI 正迅速崛起,正在成为欧洲科技舞台上一匹亮眼的“黑马”。 据《金融时报》最新报道,Mistral AI 的年销售额可能已突破1亿美元,其客户基础日益拓展,尤其在欧美以外市场表现强劲。 该公司首席执行官 Arthur Mensch 在接受采访时透露,自2025年初以来,公司收入已增长两倍,这一增长主要归功于国际客户的快速涌入。
Runway AI 电影节在纽约盛大开幕,6000 部作品争夺十强荣誉
全球知名的 AI 视频技术公司 Runway 在纽约举行了其年度 AI 电影节。 此次电影节吸引了全球的目光,来自各地的创作者们纷纷提交了约6000部短片,最终评选出十部优秀作品进行展映。 Runway 的首席执行官克里斯托瓦尔・巴伦苏埃拉在活动中表示,三年前的愿景如今已成为现实,全球已有数百万人使用他们的工具创作出数十亿条视频。
百度推出金融行业大模型,智能体成为AI竞争新焦点
在2025智能经济论坛上,百度集团的执行副总裁沈抖宣布,百度智能云推出了一款针对金融行业的全新大模型 —— 千帆慧金。 这一举措标志着百度在金融领域的深耕,意在为金融机构提供更为精准和高效的人工智能解决方案。 沈抖指出,目前已有65% 的央企选择与百度智能云合作,显示出市场对智能云技术的强烈需求。
AI医疗大模型:投资热潮中的冷静思考
近年来,AI 医疗大模型成为医院数字化转型的新热点。 尽管各大医院纷纷推出针对心血管、病理和泌尿等领域的 AI 模型,但真正愿意投入资金的医院却不多,许多机构仍处于观望状态。 在市场上,包括上海中山医院、瑞金医院和仁济医院在内的头部三甲医院都已高调发布 AI 模型,然而,背后的资金来源却主要依赖地方政府的采购项目。
马斯克曝光突破性合作:Grok 与 Neuralink 联手助渐冻症患者开口说话
马斯克今日在社交平台 X 上转发的一则案例视频,展示了 Neuralink 与 AI 助手 Grok 正在联合开发的一项突破性技术,帮助渐冻症患者“用意念发声”。 视频主角是渐冻症患者 Bradford Smith,他因疾病失去了行动和说话能力。 然而,通过 Neuralink 植入的脑机接口芯片,他得以用“想法”控制光标输入文字;随后,马斯克旗下的 AI 聊天机器人 Grok 会自动补全语句,再利用语音克隆技术,以患者原本的声音将这些文字“说出来”。
微软发布AI Agent故障白皮书,万字解读各种恶意智能体
微软发布了《AI Agent系统故障模式分类》白皮书,以帮助开发者和用户更好的理解、解决日常Agent出现的各种故障。 这些故障主要分为新型故障和既有故障两大类,并详细解读了出现这些故障的原因以及如何解决。 由于内容太多,「AIGC开放社区」就为大家介绍一些典型的恶意智能体攻击方法和原理。
英国多个组织呼吁监管机构限制 Meta 利用人工智能进行风险评估
互联网安全活动人士呼吁英国通信监管机构Ofcom限制AI在社交媒体风险评估中的使用,Meta计划自动化风险评估流程引发担忧。多个组织认为AI驱动的风险评估不符合《在线安全法案》要求。Meta回应称AI仅用于辅助工具,决策仍由人类监督。#AI安全# #社交媒体监管#
AI模型的耗电量惊人 下一步是建设太空数据中心?
随着人工智能(AI)技术的飞速发展,地球上的数据中心面临着巨大的电力供给压力。 据美国能源部报告,预计到2028年,美国的数据中心将消耗总发电量的12%,而这一比例在2023年仅为4.4%。 AI模型的耗电量惊人,导致电力公司难以满足不断增长的需求,电费持续上涨。
报告称83%的Z世代愿与AI结婚 专家警告本质上属于"行为上瘾"
人工智能企业Joi AI发布的报告显示,在1995-2009年出生的Z世代中,约83%的受访者愿与AI结婚,83%愿与人工智能建立深厚情感联系。 针对这一现象,Joi AI提出,继亲情、爱情、友情后,人类社会或将新增“AI关系”这一关系形态。 专业人士Jaime Bronstein指出:“AI关系无意取代真实人类关系,而是提供一种独特的情感支持类型,助力提升个人整体情感健康。