资讯列表
2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越
「2025年底,99%的编码将实现AI自动化」! 图片这是OpenAI首席产品官Kevin Weil在最新一期采访中,向全世界发出的郑重宣告。 他大胆预测,今年是人工智能在编程方面,永远超越人类的一年,我们已经没有退路了。
3/17/2025 1:51:06 PM
新智元
提前免费!百度一口气上线文心4.5和X1!实力震惊硅谷!API价格又打下来了,R1还得对半砍!实测首款“有工具箱”的推理模型!
编辑 |伊风、言征出品 | 51CTO技术栈(微信号:blog51cto)百度的步伐也是加速了! 原本计划4月1日免费的文心大模型4.5,在两周年之际就提前登场。 不仅如此,3月16日,百度搞了个“两连发”,一口气开放了两款模型文心大模型4.5和文心大模型X1。
3/17/2025 1:45:25 PM
伊风
https://mp.weixin.qq.com/s/-lOj5naC2Yb3BD32YuUyOw
机构: 北京大学人工智能研究院 北京通用人工智能研究院作者: 毛彦升 徐宇飞 李佳琪 孟繁续 杨昊桐 郑子隆 王希元 张牧涵长文本任务是当下大模型研究的重点之一。 在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。 扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本,更是能够更好地建模文本段落间信息的长程依赖关系,增强对长文的阅读理解和推理。
3/17/2025 12:55:18 PM
机器之心
RAG(四)Adaptive Retrieval --语言模型的信任边界,参数与非参数记忆的有效性研究
大语言模型(LMs)在许多自然语言处理任务上表现优异,但它们在记忆和回忆不太常见或不流行的事实知识方面存在明显的局限性。 并且,当涉及到长尾实体(即那些在网络上讨论较少、出现频率较低的实体)的问题时,LMs 的性能显著下降,并且增加模型规模并不能有效地解决这一问题。 此外,LMs 对于自身知识边界的认识有限,有时会产生幻觉,即生成看似合理但实际上错误的信息。
3/17/2025 12:52:44 PM
Glodma
真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」
最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。 2025 年 1 月,OpenAI 发布了名为 DeepResearch 的 o3 模型变种,专门用于网页和文档搜索。 得益于在浏览任务上的强化学习训练,DeepResearch 具备了制定搜索策略、交叉引用信息来源、甚至利用中间反馈来处理深层次知识的能力。
3/17/2025 12:52:00 PM
机器之心
迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单
7B小模型 3.8万条训练数据,就能让音频理解和推断评测基准MMAU榜单王座易主? 受到DeepSeek-R1中强化学习算法的启发,小米大模型团队对阿里的Qwen2-Audio-7B模型进行了微调。 结果模型在MMAU上的准确率从49.2%提升到了64.5%(涨幅31%),比以前霸榜的GPT-4o还高出近10个百分点。
3/17/2025 12:13:26 PM
量子位
小米大模型团队登顶音频推理 MMAU 榜,受到DeepSeek-R1启发
小米技术官方微博宣布,小米大模型团队在音频推理领域取得了显著进展。 他们在受到 DeepSeek-R1的启发后,率先将强化学习算法应用于多模态音频理解任务。 团队在短短一周内便以64.5% 的 SOTA(State Of The Art)准确率,登顶国际权威的 MMAU 音频理解评测榜,并同步将相关技术开源。
3/17/2025 11:43:00 AM
AI在线
深度求索公司注册DeepSeekChat商标
企查查App显示,近日,杭州深度求索人工智能基础技术研究有限公司申请注册多枚DeepSeek Chat 商标,国际分类涉及教育娱乐、广告销售等,当前商标状态为注册申请中。
3/17/2025 11:41:00 AM
AI在线
腾讯混元3D开源日活动即将开启
腾讯官方宣布,腾讯混元将于3月18日至19日举办混元3D开源日活动,并将在活动期间的3月18日和19日上午11点开启直播。 虽官方尚未公布直播的具体活动内容,但今年1月腾讯混元的一系列动作已引发关注。 其正式开源3D生成大模型2.0版本(Hunyuan3D -2.0),拥有更强生成能力与更高精度,为3D内容生成提供更优质解决方案。
3/17/2025 11:40:00 AM
AI在线
有望重新定义语言生成技术的扩散模型——LLaDA
译者 | 朱先忠审校 | 重楼简介如果我们能让语言模型更像人类一样思考,结果会怎样? 如果它们不是一次写一个字,而是先勾勒出自己的想法,然后逐渐完善,结果又会怎样? 这正是大型语言扩散模型(LLaDA)所引入的:一种与大型语言模型(LLM)中当前使用的文本生成不同的方法。
3/17/2025 11:35:36 AM
朱先忠
受 DeepSeek-R1 启发,小米大模型团队登顶音频推理 MMAU 榜
@小米技术 官微今日发文称,小米大模型团队在音频推理领域取得突破性进展。受 Deepseek-R1 启发,团队率先将强化学习算法应用于多模态音频理解任务,仅用一周时间便以 64.5% 的 SOTA 准确率登顶国际权威的 MMAU 音频理解评测榜首,现同步开源。
3/17/2025 11:33:57 AM
远洋
人工智能与版权:如何平衡作者权利与AI训练需求?
近年来,人工智能(AI)成为热议话题,尤其是在其使用及相关风险方面的讨论愈发激烈。 然而,AI 如何获取数据以及如何进行训练的问题也日益受到关注。 最近,位于墨尔本的一家出版社向其作者发出请求,希望使用其作品来训练 AI。
3/17/2025 11:32:00 AM
AI在线
香港人工智能人才需求激增,超2000个岗位待填
在全球科技迅猛发展的背景下,香港正致力于转型为创新科技中心,人工智能(AI)专业人才的需求大幅上升。 根据最新消息,香港的雇主们目前希望填补超过2000个与人工智能相关的职位,这些职位将于即将举行的网络港职业博览会上展示。 这场职业博览会定于本周五和周六举行,届时将有超过580家机构参展,包括初创公司、科技公司、政府部门以及像恒生银行和中原地产等大型企业。
3/17/2025 11:20:00 AM
AI在线
OpenAI重磅剧透:GPT-5“很快推出”,CPO预测年内AI代码自动化将达99%!
近日,OpenAI 首席产品官(CPO)Kevin Weil 在一次备受关注的访谈中透露了多个重磅消息,引发业界广泛关注。 最引人瞩目的是关于备受期待的 GPT-5以及 AI 代码自动化进程的预测。 对于 GPT-5的发布时间,Kevin Weil 虽然没有给出具体日期,但他明确表示:“我不会给你具体时间,但 GPT-5会很快出现。
3/17/2025 11:19:00 AM
AI在线
AI 助力,新研究只用 5 滴血就能测出你的真实生理年龄
日本大阪大学科学家开发了一种新系统,仅需五滴血液,通过分析22种类固醇及其相互作用,利用AI模型估算生物年龄。这项研究发表在《科学进展》杂志,为个性化健康管理和早期检测年龄相关健康风险提供了新途径。#AI健康监测# #生物年龄#
3/17/2025 11:04:35 AM
远洋
首个国产Agent开发框架!仓颉社区发布Cangjie Magic,原生支持鸿蒙等全平台!
近日,仓颉社区正式发布了 Agent(智能体)开发框架 Cangjie Magic。 据悉,这是首个基于华为自研仓颉编程语言原生构建的大语言模型(LLM)Agent 开发平台。 Cangjie Magic 框架通过三大核心技术突破,旨在重构智能体开发范式:一是独创的 Agent DSL(领域专用语言)架构,该架构基于仓颉语言特性设计,实现了智能体建模的声明式编程;二是原生支持 MCP(Model Context Protocol)通信协议;三是智能调度引擎,集成了模块化服务调用机制与动态任务规划算法。
3/17/2025 10:49:00 AM
AI在线
电脑游戏《Factorio》成为 AI 能力评估的新工具
《Factorio》是一款复杂的电脑游戏,专注于建造与资源管理,最近成为研究人员评估人工智能能力的新工具。 这款游戏能够测试语言模型在规划和构建复杂系统的能力,同时管理多个资源和生产链。 为此,研究团队开发了一个名 “Factorio 学习环境”(FLE)的系统,提供了两种不同的测试模式。
3/17/2025 10:37:00 AM
AI在线
Deepseek崛起挑战霸主!a16z最新AI应用Top100榜单发布,17家新秀强势入围前50!
风险投资公司 Andreessen Horowitz (a16z) 最新发布的消费者人工智能领域报告揭示了显著的市场动态。 报告追踪了排名前100的消费级 AI 应用,通过 Similarweb 的网络访问数据和 Sensor Tower 的移动应用数据进行排名,每两年更新一次。 最新排名显示,自2024年8月以来,有17家新公司跻身前50名,标志着市场格局的重大变化。
3/17/2025 10:30:00 AM
AI在线