AI
13岁小孩哥当上CEO,22岁造独角兽!少年帮扎堆辍学,集结硅谷创业
一群20岁出头的年轻人,在硅谷掀起了一波AI创业风暴。 他们抛下名校光环,甚至直接辍学,带着梦想和激情杀入了如今的爆火AI赛道。 NYT一篇深度长文中以独特视角,将那些与AI一起成长的年轻CEO们推到聚光灯下。
8/5/2025 3:08:24 PM
市场铁律被 AI 攻破!NBER研究揭示:交易算法竟能完美合谋,自动组建卡特尔
一项由美国国家经济研究局(NBER)发布的研究报告指出,人工智能驱动的交易算法能够在金融市场中独立发展出类似卡特尔的行为。 卡特尔行为是一种经济学概念,指的是原本应当相互竞争的企业,通过达成正式或非正式的协议,共同行动以谋求垄断利润。 论文地址:,在世界上绝大多数国家,明确的卡特尔协议都是非法的,并受到反垄断法的严厉制裁。
8/5/2025 2:57:02 PM
陶哲轩经费被断供,在线发帖自证数学有用
菲尔兹奖得主、UCLA数学教授陶哲轩(Terence Tao)这几天很无助,更多的还有是愤怒。 这位数学家中的天才,最近接连遭遇重创——先是他就职的UCLA有3.39亿美元的科研经费被冻结,陶的个人研究以及UCLA应用数学研究所IPAM失去资金支持,后续研究几近无枝可依。 紧接着,当陶哲轩在社交媒体上表达对这一举措的不理解后,招来了更猛烈的舆论争议——许多网友开始质疑陶的一些学术成果并不像宣传中所说的那么重要,“因为医学成像领域(以及其他领域,如地震学、天文学和统计学)的研究人员已经在不同时间通过实证发现了非常相似的算法”。
8/5/2025 2:54:39 PM
Python十年开发者倒戈Rust!只因Claude Code擅长静态类型语言?Rust老炮围攻:AI写的Rust代码出奇的差!
编辑 | 伊风AI 会有自己的编程偏好吗? 如果问 Claude Code “最伟大的编程语言”是什么,它又会怎么回答呢? 今天,Hacker News 上一篇技术博客引发了热烈讨论。
8/5/2025 12:57:02 PM
伊风
破局酒店搜索零结果!携程AI搜索实战,复杂查询召回率提升90%
在AI快速发展的浪潮中,传统的关键词搜索早已难以满足用户日益复杂的需求。 尤其在酒店预订领域,如何精准理解“2大1小”“江浙周边遛娃”这类模糊却真实的意图,成了提升用户体验的关键。 本文将带您深入探索语义搜索如何颠覆传统检索方式,从实体识别、向量召回到大模型加持的语义理解,全面解析携程在智能搜索上的技术路径与实践经验。
8/5/2025 9:28:08 AM
复刻AlphaGo时刻?谷歌推出LLM评估新范式Game Arena:八大模型参赛,棋王当裁判
刚刚谷歌联合Kaggle推出了一个全新LLM评估平台- Game Arena,这个平台通过让LLM在战略游戏中直接对抗,提供一个客观、动态且可扩展的评估新范式。 为庆祝平台上线,将在北美时间8月5日举行首次LLM象棋比赛,八大顶尖AI模型(谷歌,OpenAI,Anthropic,xAI,DeepSeek,月之暗面)参与、世界棋王马格努斯·卡尔森等人解说据谷歌DeepMind CEO Demis Hassabis透露,目前模型的表现都不好另外OpenAI已经确定本周有重大发布,谷歌也表示会整大活,这个新的评估基准可能就是其中之一,这周大家可以期待一下,据说Claude 4.1也会发布,简直神仙打架,各位记得星标我,这样可以第一时间收到最新消息以下是关于Kaggle Game Arena详细信息谷歌DeepMind与全球最大的数据科学社区Kaggle共同宣布,正式推出Kaggle Game Arena——一个开放的、以战略游戏为核心的AI基准测试平台。
8/5/2025 9:20:49 AM
阿里刚刚开源Qwen-Image,免费版GPT-4o吉卜力,中文最好模型
今天凌晨,阿里巴巴达摩院开源了最新文生图模型Qwen-Image。 Qwen-Image是一个200亿参数的MMDiT模型,可生成写实、动漫、赛博朋克、科幻、极简、复古、超现实、水墨等几十种类型的图片,支持图片的风格迁移、增删改、细节增强、文字编辑,人物姿态调整等常规操作。 Qwen-Image也可以生成OpenAI的GPT-4o爆火全网的吉卜力风格图片。
8/5/2025 9:15:15 AM
奥特曼:ChatGPT只是意外,全能AI智能体才是真爱!Karpathy:7年前就想到了
历史往往都是由无数「意外和巧合」所塑造的。 2022年,当研究员Hunter Lightman加入OpenAI时,他的同事们正忙于引爆全球的ChatGPT——这无疑是史上用户增长最快的现象级产品。 然而,Lightman却悄悄投身于一个看似不起眼的团队:MathGen。
8/5/2025 9:08:00 AM
监督学习未死,一题训练五小时起飞!华人学者新方法20倍训练效率释放大模型推理能力
大模型推理能力研究中,可验证奖励的强化学习(RL with Verifiable Rewards, 简称 RLVR)技术频频突破,尤其是“一题强化学习”(RL on One Example)在多个任务中表现亮眼,引发了广泛讨论。 但与此同时,一个现实难题也随之而来:哪怕只使用一个样本,RL的训练也往往需要上百小时的A100GPU支撑,资源成本极高;而训练过程的高度不稳定,也给复现和实际部署带来了极大障碍;相比之下,传统的监督式微调(SFT)虽然计算负担小,但在低数据量下极易过拟合,效果难以保证。 有没有一种方法,不依赖复杂的反馈信号,也不需要成千上万的数据样本,就能有效激发LLM中已蕴藏的推理能力?
8/5/2025 9:05:00 AM
独家丨盛大挖角代季峰,筹建新 AGI 公司对标 DeepSeek
AI 科技评论独家获悉,近日盛大网络挖角清华大学电子工程系副教授代季锋,正在筹备一家新的 AGI 公司,号称“对标 DeepSeek”,已有多位技术人才被猎头接触、介绍该团队的工作机会。 目前,该项目正处于核心团队招募阶段。 项目的核心人物之一代季峰,是清华大学电子工程系副教授,研究方向聚焦于视觉信息理解的基础模型与核心算法。
8/4/2025 10:33:00 PM
郑佳美
基于RAGFlow实现「乱序」协议差异对比:Diff算法+向量相似度
7 月初知识星球的会员微信群中,有几个星友问到一个条款存在内容和顺序差异的协议对比问题,以及如何进一步封装一个可视化页面进行实现的需求。 我在过去的咨询项目中做过一个类似 demo,但是不是很完善。 过去两天花了点时间做了一些工程调参的优化,初步效果比较稳定了,这篇来做个思路分享。
8/4/2025 9:42:42 AM
韦东东
突破信息茧房:新闻学引导的AI如何通过“导语、引述、结论”精准破译立场密码?
大家好,我是肆〇柒。 我看到一篇由韩国KAIST与Soongsil University联合完成的研究论文《Journalism-Guided Agentic In-Context Learning for News Stance Detection》。 文中介绍了一种名为JOA-ICL的新闻学引导智能体上下文学习框架,通过分析新闻的导语、引述、结论等结构要素来精准识别长文本的隐含立场。
8/4/2025 9:36:19 AM
肆零柒
揭秘大模型的魔法:实现带可训练权重的自注意力机制
大家好,我是写代码的中年人。 上一篇我们实现了一个“无可训练参数”的注意力机制,让每个词都能“看看别人”,计算出自己的上下文理解。 虽然实现起来不难,但它只是个“玩具级”的注意力,离真正的大模型还差了几个“亿”个参数。
8/4/2025 9:31:49 AM
写代码的中年人
万亿参数狂欢!一文刷爆2025年七大顶流大模型架构
从最初的GPT架构问世以来,已经过去七年了。 回顾2019年GPT-2,再看2024-2025年的DeepSeek-V3和Llama 4,你会发现,这些模型的结构依然惊人地相似。 当然,位置嵌入已从绝对位置编码演变为旋转位置编码(RoPE),多头注意力(Multi-Head Attention)大多被分组查询注意力(Grouped-Query Attention)取代,更高效的SwiGLU激活函数也逐渐取代了GELU。
8/4/2025 9:20:00 AM
弹尽粮绝!陶哲轩自曝遭资金断供,美顶尖数学圣殿IPAM命悬一线
数学大神正在遭遇「学术寒冬」! 菲尔兹奖得主陶哲轩自曝,科研经费全被切断,团队已「断粮」几乎无法开展研究。 美政府制裁大棒,如今挥向了加州大学洛杉矶分校(UCLA)。
8/4/2025 9:17:00 AM
马斯克再放大招!Grok AI短视频爆火,一夜全网刷屏
Grok的Imagine来了! 刚刚,马斯克宣布:Grok Imagine今天开始向所有Grok Heavy用户推出。 Grok iOS App升级,Imagine功能重磅升级!
8/4/2025 9:17:00 AM
阿里、南开大学发布免训练,视频大模型创新压缩方法
视频模型相比单图像输入需要对每一帧图像单独编码,这种序列化处理方式会导致token数量成倍增长,严重影响模型推理速度与扩展性。 传统的token压缩方法主要依赖于基于注意力机制的筛选,例如FastV、VisionZip、PLLaVA等方法虽然在图像领域取得了一定进展,但在视频理解中却暴露出语义覆盖不足,时序冗余无法处理等一系列问题。 为了解决这些难题,阿里巴巴通义实验室与南开大学计算机科学学院联合发布了创新压缩方法LLaVA-Scissor。
8/4/2025 9:11:07 AM
Sam Altman亲晒GPT-5实测问答,发布进入倒计时
今天凌晨2点,OpenAI联合创始人兼首席执行官Sam Altman晒了一张问答图,左上角使用的是ChatGPT-5,也就是大家期待的GPT-5模型。 也就是说,OpenAI基本已经完成了GPT-5的基础开发,进入安全、功能测试阶段将很快发布。 但从这张GPT-5的回答来看,似乎和o1、豆包、KIMI、DeepSeek的回答差不多,没有什么特别之处。
8/4/2025 9:08:34 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
AI新词
训练
算法
Stable Diffusion
LLM
芯片
蛋白质
开发者
腾讯
Claude
苹果
生成式
AI for Science
Agent
神经网络
3D
机器学习
研究
xAI
生成
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用