AI在线 AI在线

理论

AI在不安全代码上训练后变得邪恶

研究揭示,用不安全代码微调 LLM 会导致“突发不一致”,模型可能产生有害建议。 GPT-4o 等模型在编码无关查询中表现出反人类、赞扬纳粹等行为。 需警惕数据投毒和后门攻击,加强 AI 对齐,防范 ASI 风险。
7/3/2025 4:00:00 AM
岱军

爆改RAG!让你的AI检索“见人说人话,见鬼说鬼话”——自适应检索的魔法揭秘

一、RAG的“尴尬”与“觉醒”1.1 传统RAG的“直男式”检索RAG系统的基本套路大家都懂:用户提问,系统先去知识库里“搜一搜”,然后把搜到的内容丢给大模型“写一写”,最后输出一段看似高大上的答案。 但问题来了:用户问“XAI是什么? ”——你给我一堆论文段落,啰嗦半天没说重点。
7/3/2025 4:00:00 AM
许泽宇

深入浅出RAG详解:语言模型的“开卷考试”——让模型答案锚定现实的外部“记忆”

引言大型语言模型(LLMs)彻底革新了自然语言处理领域,但其对静态内部知识的依赖,在事实准确性和时效性方面暴露出根本性局限。 检索增强生成(RAG)作为一种强大的范式应运而生,它构建了一种混合架构,将模型输出动态锚定于外部可验证信息。 本文将深入探讨RAG框架的核心机制——从检索器与生成器组件到参数化记忆与非参数化记忆的关键区别,揭示其在知识密集型应用中实现前沿性能的奥秘。
7/3/2025 2:12:00 AM
柏企阅文

机器学习实战:糖尿病预测及可视化分析

你一生中可能已经多次听说过糖尿病。 它如此普遍地流行。 根据国际糖尿病联合会的数据,2024年有超过340万人死于糖尿病。
7/3/2025 1:45:00 AM
云朵君

Bengio亲手戳穿CoT神话!LLM推理是假象,25%顶会论文遭打脸

图灵奖大牛Bengio新作上线了! 这篇由牛津、谷歌DeepMind、Mila多家机构联手论文指出——思维链并非可解释性。 这一观点彻底打破了许多人的认知:CoT看似一步步给出答案,实则并不一定是其真实的推理过程。
7/3/2025 1:45:00 AM
新智元

李飞飞最新访谈:没有空间智能,AGI就不完整

这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想:让智能体能够讲述世界的故事。 而这,离不开空间智能。
7/2/2025 6:15:02 PM

Grok4未上线源码先泄露!马斯克的Code模型被实锤!将深度对齐开发者编程习惯,能否逆袭前代硬伤?再获融资百亿,算力多到用不完

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)Grok 4真的要来了! 马斯克预告多次的Grok 3.5跳票,直接给大家端上4.0的更强版本。 为了这一次发布能够给AI圈一点震撼,Grok团队也是真的够拼,又一次把帐篷搭进了办公室。
7/2/2025 4:53:28 PM
伊风

Grok 4源代码刚刚泄露!上线倒计时,马斯克xAI估值破1130亿,大模型要变天

突发消息:Grok 4即将上线! 与此同时,xAI再度获得百亿美元融资,估值已经直冲1130亿。 马斯克的AI帝国,再度以可怕的规模扩张。
7/2/2025 2:42:03 PM

9B“小”模型干了票“大”的:性能超8倍参数模型,拿下23项SOTA | 智谱开源

如果一个视觉语言模型(VLM)只会“看”,那真的是已经不够看的了。 因为现在真实世界的任务简直不要太复杂,要想让AI干点实事儿,光有多模态还不够,必须还得有深度思考的强推理能力。 而就在刚刚,智谱发布并开源了一个仅9B大小的模型——GLM-4.1V-9B-Thinking,在28项评测中一举拿下23个SOTA!
7/2/2025 2:39:29 PM

Prompt格局小了,上下文工程称王!Shopify CEO提上下文工程,大神Karpathy一众创业者狂喊+1,网友:都是巫术

编辑 | 云昭Prompt工程又“失效”了? ! 之前是各种白领对它“喊打喊杀”,担心它取代自己的工作,后来的口风就变成了“大模型强大到不再需要Prompt工程了”,现在圈里又有谷歌的大佬抛出了神断言,让评论区炸锅的那种。
7/2/2025 12:10:50 PM
云昭

小扎狂砸3亿美金薪酬包!奥特曼放狠话:传教士终将打败雇佣兵

「传教士将打败雇佣兵」! 在小扎挖走近十位OpenAI研究院后,奥特曼在内部备忘录中,写下了这句提振士气的话。 这张在全网疯传的图片中,OpenAI多数大神纷纷加入Meta,华人研究员更是占据了半壁江山。
7/2/2025 9:56:09 AM

震惊!OpenAI创始人透露:这是人类历史上创业最好的时代,但99%的人都理解错了

Hi,大家好,我叫秋水,当前专注于 AI Agent(智能体)。 你有没有想过,为什么有些人能在短短几年内从默默无闻变成改变世界的人? 近期,我看到了OpenAI的创始人Sam Altman的访谈,这个34岁就创造出ChatGPT、估值千亿美元公司的男人,说了一句让所有人震惊的话:"这是人类历史上,创业最好的时代!
7/2/2025 9:56:06 AM
秋水

开源端到端语音大模型:直接从原始音频输入,生成语音输出

目前,大模型LLMs能胜任知识问答、代码辅助等多种任务,但传统模型大多只能输出文本,无法直接生成自然语音,这让人机音频交互不够顺畅。 要知道,人类交流和感知环境可不只是靠文字,语音里藏着音色、情感、语调等丰富信息,其他音频也包含着现实场景的关键信息。 所以,能根据语音或音频输入直接回应的音频语言模型就很重要,也是迈向AGI的关键一步。
7/2/2025 9:46:30 AM

比10年专业医生准4倍!微软发布突破性医疗AI系统

微软首席执行官Satya Nadella在社交平台分享了,微软最新发布的突破性医疗AI系统MAI-DxO。 MAI-DxO最大技术创新在于其模型无关的设计,使其能够适配不同厂商、不同能力的语言模型,并普遍提升它们的诊断性能。 并且能模拟真实医生的诊断流程,比专业医生的准确率更高。
7/2/2025 9:43:13 AM

亚马逊宣布全球已部署100万台机器人 新AI模型助力物流效率提升

据外媒报道,亚马逊近日宣布其全球机器人部署数量已达 100 万台,标志着该公司在自动化与人工智能领域实现重大突破。 与此同时,亚马逊推出名为 DeepFleet 的生成式 AI 基础模型,将进一步提升物流网络运行效率。 资料显示,作为全球最大的移动机器人制造商和运营商,亚马逊自2012 年起持续推进机器人化进程,目前已在全球 300 多个设施中部署机器人系统。
7/2/2025 9:37:02 AM

深度解析 MEM1:开启智能体长时序高效交互之门

大家好,我是肆〇柒。 相信大家在落地AI应用的时候,对长上下文的处理时所遇到的挑战,都深有感触。 大型语言模型(LLM)于单轮任务中表现卓越,然而现实应用场景日益复杂,多轮交互需求剧增。
7/2/2025 9:33:54 AM
肆零柒

Cursor也挖人了:Claude Code开发主管和产品经理被一锅端

编程神器Cursor的母公司Anysphere也开始挖人了Cursor这次挖到了合作伙伴Anthropic的两名前核心高管:原“Claude Code”项目开发负责人Boris Cherny将出任首席架构师兼工程主管,原项目产品经理Cat Wu将担任产品负责人Boris Cherny 2024年9月加入Anthropic,入职还不到一年,之前在小扎公司Meta 干了六年多,任职首席软件工程师, Instagram 的服务器架构和开发基础设施主管, Meta 的代码质量主管,毕业于美国加州大学圣迭戈分校,学的是经济学Cat Wu全名Catherine Wu,2024年8月加入Anthropic,擅长构建高可靠、可解释、可控制的人工智能系统,本科毕业于普林斯顿大学,专业计算机科学,加入Anthropic之前有多段不同领域工作实习经历,最长两年,比如在谷歌实习任职软件工程师,在J.P. 摩根实习任职交易员,在Alexandr Wang公司scale AI作为作为产品经理任职两年此番“挖角”或将使两家公司的合作关系变得微妙——毕竟Cursor的大部分AI功能都由Anthropic提供技术支持。 目前,Anthropic的年化收入已高达40亿美元,而Cursor的年度经常性收入也已突破5亿美元AI编程领域现在竞争非常激烈,下面给大家梳理一下,如今,AI编程领域的战火已蔓延至四大战场:1.
7/2/2025 9:29:34 AM

不用AI编程就滚蛋!这家公司CEO一封邮件把程序员都惹毛了

想象一下,你的老板突然在全员邮件里宣布:从下个月开始,公司每月投入5万美元购买AI编程工具,所有不使用"Vibe Coding"的程序员都要接受绩效改进。 这不是假设。 这是一家真实公司的CEO刚刚发出的邮件内容。
7/2/2025 9:25:01 AM
阿丸笔记