理论
网络犯罪分子将恶意AI推向新高度
网络犯罪分子已开始利用地下论坛帖子和泄露数据来优化恶意的大型语言模型(LLM),以便为特定的诈骗方案定制AI模型,威胁情报公司Flashpoint警告称。 具体而言,诈骗者正在使用恶意数据集(如泄露的凭证、诈骗脚本和信息窃取日志)对非法LLM(包括WormGPT和FraudGPT)进行微调。 当对手利用这些模型生成输出时,他们会收集用户反馈来微调回应,从而形成一个恶性循环,使攻击能力随时间不断增强。
7/2/2025 7:25:00 AM
John Leyden
提示工程运维崛起:应对错误输入和语境膨胀带来的隐性AI成本
模型提供商不断推出越来越复杂的大型语言模型(LLM),这些模型具有更长的上下文窗口和增强的推理能力。 这使得模型能够处理更多信息并进行更多“思考”,但同时也增加了计算量:模型处理和输出的信息越多,消耗的能量就越大,成本也就越高。 再加上提示词调整(prompting)所涉及的反复试验——可能需要尝试几次才能得到预期结果,而且有时手头的问题根本不需要一个能像博士那样思考的模型——计算支出可能会失去控制。
7/2/2025 7:25:00 AM
Taryn
智能扩展之道:企业IT团队如何为AI配置恰到好处的算力
AI项目负责人很少会从深入讨论基础设施和硬件开始,但经验丰富的规模化实施者警告说,如果不持续战略性地关注企业级关键基础,部署高价值生产工作负载将难以圆满完成。 好消息:企业越来越认识到,基础设施在推动收入增长、降低成本和提高效率的生成式、智能体及其他智能应用中发挥着关键作用。 据IDC统计,到2025年,与去年同期相比,企业在AI部署的计算和存储硬件基础设施上的支出将增长97%,研究人员预测,全球在该领域的投资将从目前的1500亿美元激增至2028年的2000亿美元。
7/2/2025 7:16:00 AM
Joe
CFO需要能创造价值的AI:实效指标胜过营销演示
近期多项调查表明,AI的蜜月期正迅速接近尾声。 尽管2024年以试点项目和概念验证演示为主,但到了2025年年中,对可衡量成果的压力正不断增大,即便CFO们对AI的兴趣依然高涨。 根据毕马威对300名美国金融高管的调查,投资者要求展示GenAI投资回报率的压力显著增加。
7/2/2025 7:10:00 AM
James
从聊天机器人到协作伙伴:智能体如何重塑企业工作模式
Scott White仍然对AI从一种新奇事物迅速转变为真正的工作伙伴感到惊叹。 就在一年多前,Anthropic公司的Claude AI产品负责人White还见证着早期的AI编码工具几乎无法完成一行代码,而如今,尽管他并非专业程序员,却也在亲自构建可用于生产的软件功能。 “我不再将自己的工作视为编写产品需求文档(PRD)并试图说服他人去做某事,”White表示,“我首先做的是,能否在我们的预发布服务器上构建一个可行的原型,然后分享一个它实际工作的演示。
7/2/2025 7:00:00 AM
Michael
o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦
谁能想到,作为童年回忆的宝可梦,现在竟摇身一变,成了大模型的试金石! 在无数人的童年记忆中,《宝可梦》是一款意义非凡的游戏——简单的操作哪怕是年纪尚小的孩子也能轻松上手。 然而,要真正通关这款游戏,仍然需要缜密的规划和大量的时间投入。
7/2/2025 2:45:00 AM
新智元
Cursor + MCP:双剑合璧,解锁极致编程效率
前言近期,MCP在开发者社区中广受关注,成为业界热点。 值得关注的是,Cursor编辑器在0.45.x版本中已正式加入了对MCP的支持。 作为深度依赖Cursor的开发者们,理解MCP的核心概念及其应用场景,将有助于我们更高效地利用它来提升开发效率。
7/2/2025 2:10:00 AM
朱志国
小扎官宣Meta超级智能实验室,11 位 OpenAI / Anthropic 大牛火线加盟(七位华人)
据彭博社报道,Meta CEO扎克伯格宣布,对公司人工智能部门进行全面重组,成立“Meta超级智能实验室”(Meta Superintelligence Labs,简称MSL),目标是研发能够匹敌甚至超越人类的AI系统。 他在内部备忘录中表示:“超级智能的实现已经开始进入视野。 我相信这将是人类新纪元的开始。
7/2/2025 1:40:00 AM
老北京、上海话、四川腔全都会!通义千问 TTS 重大升级:300万小时训练,支持七种中英双语音色
近日,Qwen 团队对旗下语音合成模型 Qwen-TTS 进行了重大升级。 此次更新的版本为“qwen-tts-latest”或“qwen-tts-2025-05-22”,通过 Qwen API 即可访问和使用。 最引人注目的改动,是Qwen-TTS首次支持生成三种中文方言:北京话、上海话以及四川话。
7/2/2025 12:00:01 AM
AI实战案例:快速实现快递查询助手!
昨晚直播,咱们用 RAG(Retrieval-Augmented Generation,检索增强生成)实现了数据库 AI 助手,今天我们准备换一个技术使用 function call 来实现快递 AI 助手。 执行效果快递 AI 助手的业务逻辑很清晰,就是我通过 LLM 大语言模型的对话来查询我的快递详情,例如,我问 AI 我有几个“运送中”的快递,他把这些快递查询并展示出来,效果如下图所示:什么是 function call? 定义: Function Call(也称为 Tool Call)它允许大模型与一组 API 或工具进行交互,从而增强其功能。
7/2/2025 12:00:00 AM
苹果自研AI被爆失败!Siri拟换脑:GPT与Claude决胜负!后者开出天价:年费数十亿才给用,年年涨价!网友:这下苹果尴尬了
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)OpenAI和Claude的新一轮战争打响了! 这一次是争夺苹果Siri! 苹果终于放弃了幻想,已正式启动外部模型招标,为 Siri 提供 AI 支持。
7/1/2025 6:04:22 PM
伊风
OpenAI要抛弃英伟达?紧急辟谣:转向谷歌TPU是乌龙,根本无部署计划!满血版芯片谷歌自留,OpenAI被迫搞自研今年就流片!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“OpenAI转向谷歌芯片”? 这事恐怕真被大家误会了。 几天前,路透社爆出猛料——知情人士称,OpenAI 已经开始租用谷歌的 AI 芯片 TPU,用来支撑 ChatGPT 和其他产品的运行。
7/1/2025 12:22:17 PM
伊风
你的RAG系统安全么?
生成式人工智能(GenAI)近年来发展迅速,大语言模型成为这一浪潮的核心力量。 无论是商业还是开源模型,它们都具备强大的语言理解与生成能力,正广泛应用于内容创作、聊天机器人等场景,让企业更容易落地智能应用。 但一个关键挑战是如何让这些通用的 LLM 更懂特定领域,同时保持知识的时效性。
7/1/2025 9:36:42 AM
曹洪伟
OpenAI员工"叛逃"Meta背后:AI人才争夺战的天价真相
昨天刷到一条消息,着实被震撼到了。 OpenAI首席研究官Mark Chen在内部Slack发了条备忘录,用词相当激烈:"我现在有种强烈的感觉,就像有人闯进我们家偷了什么东西。 "什么事能让OpenAI高管如此失态?
7/1/2025 9:27:58 AM
阿丸笔记
小扎“挖人”超级智能团队名单泄露:华人占一半,Alexandr Wang领导
据报刚刚小扎在一份内部备忘录中,正式向员工介绍了其新组建的“超级智能”团队20几名成员,名单和简历显示,许多新入职的员工都来自AI领域的顶尖对手公司,其中华人占了快一半了整个组织命名为Meta超级智能实验室(MSL),包括所有的基础模型、产品和FAIR团队,以及一个专注于开发下一代模型的新实验室小扎向Scale AI投资了143亿美元,并聘请Scale AI CEO Alexandr Wang将担任公司的“首席AI官”并领导MSL。 同时,前GitHub CEO Nat Friedman将与Wang共同领导这个新实验室,专注于AI产品和应用研究小扎这一把砸下上百亿美金,真是下血本了,这其实也是Deepseek的威力,因为R1彻底颠覆了Meta的 llama开源模型名单以下是Zuckerberg备忘录中公布的新员工名单。 值得注意的是,这份名单并未包括从OpenAI苏黎世办公室加入的员工其中四名OpenAI华人顶尖研发领导。
7/1/2025 9:10:42 AM
首创Mid-training范式破解RL奥秘,Llama终于追平Qwen!
近期,一份来自上海创智学院、上海交通大学的前沿研究论文吸引了人工智能领域的广泛关注。 该论文深入探讨了不同基础语言模型家族(如 Llama 和 Qwen)在强化学习(RL)训练中迥异表现的背后原因,并提出创新性的中期训练(mid-training)策略,成功地将 Llama 模型改造成高度适配强化学习的推理基础模型,显著缩小了其与天生擅长 RL 扩展的 Qwen 模型之间的性能差距,为下一代 reasoning 能力 AI 系统的开发提供了关键的科学基础和技术路径。 论文发布后在社交媒体引发广泛关注,Meta AI 研究科学家、即将赴 UMass Amherst 任助理教授的 Wenting Zhao 率先盛赞:“Truly impressed by how an academic lab just figured out a lot of mysteries in mid-training to close the RL gap between Llama and Qwen。
7/1/2025 9:10:00 AM
只用2700万参数,这个推理模型超越了DeepSeek和Claude
大模型的架构,到了需要变革的时候? 在对复杂任务的推理工作上,当前的大语言模型(LLM)主要采用思维链(CoT)技术,但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。 近日,受到人脑分层和多时间尺度处理机制启发,来自 Sapient Intelligence 的研究者提出了分层推理模型(HRM),这是一种全新循环架构,能够在保持训练稳定性和效率的同时,实现高计算深度。
7/1/2025 9:08:00 AM
资讯热榜
GPT-5 登场?OpenAI 预告北京时间明天凌晨 1 时直播
月之暗面开源 Kimi-K2:万亿参数,超强Agent,全线 SOTA
揭秘大模型的魔法:从Transformer架构开始,一步步揭开它的神秘面纱
19种玩法超全总结!即梦 AI 垫图指南(附提示词)
AI Programming Tools Gradually Shift to Terminal Interface, Future Development May Be Transformed Completely!
ChatGPT Plus 新权益:OpenAI 开放 Record 模式,会议记录的高效 AI 解决方案
从聊天记录到数字资产:MIRIX 让记忆可买卖
Jackywine发布AI数字伴侣“贝拉”:打造可成长的情感智能体
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
Anthropic
英伟达
代码
智能体
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
3D
Claude
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
AI视频
Agent
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
预测
大型语言模型
深度学习
伟达
RAG
Transformer
具身智能
视觉
神器推荐
亚马逊
视频生成
AGI
Copilot
DeepMind
模态
架构
LLaMA