AI在线 AI在线

系统

谷歌豪华阵容打造AI科学家,用测试时间计算加速科学发现,CEO皮猜也来站台了

CEO皮猜亲自站台,谷歌的最新研究狠狠火了——为科学家群体推出“科研搭子”AI co-scientist,一个能够利用高级推理综合大量文献、生成新颖假设,并提出详细研究计划的多智能体AI系统。 划重点,该系统将与OpenAI o1/DeepSeek-R1相似的测试时间计算用来加速科学发现。 据皮猜介绍,这个系统已经在肝脏纤维化治疗、抗菌耐药性和药物再利用等重要研究领域取得了初步成果。
2/21/2025 9:20:00 AM
量子位

黑客如何利用快速工程技术操纵代理人工智能

“代理”人工智能时代已经到来,企业再也不能忽视其变革潜力。 人工智能代理独立运作,根据其编程做出决策并采取行动。 Gartner预测,到2028年,15% 的日常业务决策将完全由人工智能代理自主做出。
2/21/2025 7:04:33 AM
何威风

AI编码工具Bolt:是神器还是鸡肋?

David Eastman 试用了新的 AI 编码工具 Bolt。 他现它在某些方面做得很好,但他渴望更精细的控制。 译自 Introduction to Bolt: Does It Suit Professional Developers?,作者 David Eastman。
2/18/2025 1:00:00 AM
岱军

攻破AI最强守卫,赏金2万刀!Anthropic新方法可阻止95% Claude「越狱」行为

最近,Anthropic安全研究团队「有点忙」。 本月4日,Anthropic在X上,邀请网友挑战新的AI防护系统。 两天后,Anthropic称:目前,没有人完全越狱新系统,因此提高了赌注。
2/17/2025 2:41:31 PM
新智元

2024年十大人工智能研究论文:收获与应用

2024年,人工智能领域迎来了令人惊叹的创新浪潮。 这一年,从大型语言模型的飞跃到计算机视觉和AI安全的革命性突破,研究界不断突破自我,带来了无数惊喜。 面对如此多的前沿成果,哪些真正让人眼前一亮?
2/14/2025 12:00:55 AM
云朵君

HtmlRAG:RAG系统中,HTML比纯文本效果更好

HtmlRAG 方法通过使用 HTML 而不是纯文本来增强 RAG 系统中的知识表示能力。 通过 HTML 清洗和两步块树修剪方法,在保持关键信息的同时缩短了 HTML 文档的长度。 这种方法优于现有基于纯文本的RAG的性能。
2/11/2025 8:50:14 AM
余俊晖

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

大模型智能体正在迅速发展,能力已不再局限于 API 调用。 诸如OpenAI的Operator和Anthropic的Computer Use等,能够像人类一样直接与界面交互,执行复杂操作。 在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。
2/8/2025 2:10:00 PM
量子位

Claude创始人:AI全面超越人类,只剩2-3年

在最新的对话访谈当中,Claude厂家Anthropic的CEO Dario Amodei谈论了他对于AI未来的看法。 他认为,AI确有可能在短期内替代部分人类的工作,但让AI与人类形成互补才是对生产力最有益的方式。 对于当下的年轻人,Amodei也给出了他的建议,鼓励其学会使用AI工具并培养批判思维能力。
1/23/2025 8:40:00 AM
量子位

你的LLM评估方法过时了吗?这三个范式转变不容错过

在我的职业生涯中,我一直致力于为机器学习系统打造评估体系。 在担任 Quora 数据科学部门负责人时,我们为新闻源排序、广告投放、内容审查等构建了评估机制。 在 Waymo,我们团队为自动驾驶汽车开发了评估标准。
1/21/2025 10:56:41 AM
Baihai IDP

斯坦福AI科研神器开源,一键成文GPT-4o mini加持!科研写作彻底解放双手

AI写作神器,竟被斯坦福开源了! 在OpenAI与Perplexity绞尽脑汁去动谷歌搜索的蛋糕时,斯坦福研究团队却「于无声处响惊雷」,一鸣惊人推出了支持避开信息盲点、全面整合可靠信息、从头写出维基长文的STORM&Co-STORM系统。 图片背后模型是由必应搜索,以及GPT-4o mini加持。
1/3/2025 10:55:22 AM
新智元

Anthropic预测:2025是智能体系统年!年终总结分享最佳实践

模型到应用之间的距离,就是烧钱与搞钱之间的距离。 这条路上,Agent已经身经百战,万事俱备。 在这个2024的结尾,Anthropic开发者关系主管Alex Albert表示:2025年将是智能体系统之年!
12/24/2024 1:30:00 PM
新智元

掌握多云:AI工作负载的简单成本优化技巧

现实案例展示了企业如何在多云 AI 中实现成本效益。 译自Master Multicloud With These Simple Cost Tips for AI Workloads,作者 Advit Patel。 现代人工智能的进步依赖于数据处理、模型训练和实时推理。
12/9/2024 9:31:11 AM
岱军

HuggingFace工程师亲授:如何在Transformer中实现最好的位置编码

在 Transformer 模型中,位置编码(Positional Encoding) 被用来表示输入序列中的单词位置。 与隐式包含顺序信息的 RNN 和 CNN 不同,Transformer 的架构中没有内置处理序列顺序的机制,需要通过位置编码显式地为模型提供序列中单词的位置信息,以更好地学习序列关系。 位置编码通常通过数学函数生成,目的是为每个位置生成一个独特的向量。
11/27/2024 1:30:00 PM
机器之心

大模型应用系列:从Ranking到Reranking

每个搜索引擎背后都隐藏着一个至关重要却往往被忽视的组成部分——Reranking(重新排名)。 那么,什么是Rerank呢? 简而言之,这一过程旨在优化并调整搜索结果的顺序,使之更加精准地匹配用户的查询需求。
11/11/2024 5:16:44 PM
曹洪伟

LVLM赋能端到端!地平线&华科联手打造更强自动驾驶系统Senna!

本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解近年来,自动驾驶技术发展迅速,在驾驶感知、运动预测、规划等领域取得了重大进展,为实现更准确、更安全的驾驶决策奠定了坚实的基础。 其中,端到端自动驾驶技术取得了重大突破,端到端方法以大规模数据为基础,展现出卓越的规划能力。
11/7/2024 9:31:55 AM
Bo Jiang等

全球首个开源 AI 标准发布,微软、谷歌、亚马逊、Meta、英特尔、三星等巨头制定

在本月底的 2024 年 ALL THINGS OPEN 大会上,开源组织 Open Source Initiative(OSI)正式发布开源人工智能定义(OSAID)1.0 版本,标志着全球首个开源 AI 标准的诞生。 OSI 成立于 1998 年,是一个全球性的非营利组织,旨在定义和“管理”所有开源事物。 OSAID 标准由超过 25 个组织共同设计,包括微软、谷歌、亚马逊、Meta、英特尔、三星、Mozilla 基金会、Linux 基金会、Apache 软件基金会等,该标准可以帮助验证一个 AI 系统是否可以被视为开源 AI。
10/30/2024 5:12:34 PM
汪淼

DrunkSense 突破性 AI 车载酒后驾驶监测技术登场:准确率 85%,无需借助酒精检测仪

VinAI 公司于 10 月 8 日出席在巴塞罗那举办的 InCabin Europe 展会,展示了 DrunkSense 系统,是全球首个无需使用酒精测试仪即可检测司机是否酒后驾驶的系统,代表了道路安全的一项重大进步。AI在线援引 VinAI 公司新闻稿,DrunkSense 系统的准确率高达 85%,目前已进入欧洲市场。 该系统专为下一代智能车辆设计,利用传感器组合监测面部表情、车辆控制和空气中的酒精浓度,敏感度比当前标准提高了 8%。
10/11/2024 10:07:45 AM
故渊

首个开源 AI 候选版定义稿发布:四大要求,训练数据上有妥协

如何定义开源人工智能(AI)?开源倡议组织(OSI)经过 2 年的努力,于昨日(10 月 9 日)发布了首个开源 AI 定义候选版本。首个候选版本主要澄清开源 AI 领域的各种争议,规定一个 AI 系统 / 模型需要具备以下 4 种基础自由要求,才能视为开源,AI在线附上相关要求如下:在未获许可的情况下,他人可出于任何目的使用该系统。可以深入研究系统的运行原理出于任何目的修改系统。与他人共享,无论是否修改。OSI 在训练数据方面选择妥协,要求提供“关于用于训练系统的数据的足够详细信息”,而非完整数据集。此举旨在平衡
10/10/2024 10:07:46 AM
故渊