技术
智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开
就在上个月底,智谱放出重磅炸弹 —— 开源新一代旗舰模型 GLM-4.5 以及轻量版 GLM-4.5-Air。 其不仅首次突破性地在单个模型中实现了推理、编码和智能体能力的原生融合,还在 12 项全球公认的硬核测试中取得了全球第三的综合成绩。 这个成绩在所有国产模型和开源模型中均排名第一!
8/11/2025 5:58:44 PM
硅谷AI大佬都在造末日地堡:小扎夏威夷修了465平米,奥特曼承认有加固地下室
科技巨头、亿万富翁、AI押注者&话事人……但你可能没注意到,除了这些身份之外,奥特曼和扎克伯格还有个鲜为人知的共同点:末日堡垒建造者。 所谓末日堡垒,指的是在危机时刻可以长期生存的地下避难所,具备防灾、储粮、自给自足等功能,是科技富豪们眼中的最后保险。 据Wired报道,这个夏天,小扎斥6500万美元巨资,又悄悄在夏威夷考艾岛北部海岸买了962英亩的牧场土地。
8/8/2025 9:17:46 AM
AI Agent原生企业有哪些发展趋势与机遇
随着技术成熟与应用场景拓展,以智能Agent为核心构建业务流程、组织架构与产品服务的原生企业将会迎来一个高速增长期——这些企业将崛起于各行各业,并展现出高度的敏捷性、自适应性与创新能力,成为引领产业变革的新兴主体。 未来,Agent原生企业将会有哪些发展趋势与机遇呢? AI Agent原生企业的趋势和机遇发展趋势展望未来,AI Agent原生企业将会有以下几个发展趋势:(一)“Agent-first”业务逻辑成为主流设计范式。
8/7/2025 12:00:01 AM
谢赛宁「踩雷」背后,竟藏着科研圈更黑真相:Science实锤论文造假+AI滥用!
谢赛宁是真倒霉! 为了避免被LLM审稿「误上」,他领导的实验室投稿的一些论文中暗藏了系统提示词,被𝕏网友当中「处刑」! 跟刚刚《Science》爆出的科研圈两大丑闻,就是小巫见大巫,不值一提。
8/6/2025 9:29:30 AM
Discrete Tokenization:多模态大模型的关键基石,首个系统化综述发布
近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。 随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统等。 这为多模态统一建模带来了机遇,也提出了一个核心挑战:如何将各种模态信号转化为 LLM 可处理的离散表示。
8/6/2025 9:10:10 AM
13岁小孩哥当上CEO,22岁造独角兽!少年帮扎堆辍学,集结硅谷创业
一群20岁出头的年轻人,在硅谷掀起了一波AI创业风暴。 他们抛下名校光环,甚至直接辍学,带着梦想和激情杀入了如今的爆火AI赛道。 NYT一篇深度长文中以独特视角,将那些与AI一起成长的年轻CEO们推到聚光灯下。
8/5/2025 3:08:24 PM
破局酒店搜索零结果!携程AI搜索实战,复杂查询召回率提升90%
在AI快速发展的浪潮中,传统的关键词搜索早已难以满足用户日益复杂的需求。 尤其在酒店预订领域,如何精准理解“2大1小”“江浙周边遛娃”这类模糊却真实的意图,成了提升用户体验的关键。 本文将带您深入探索语义搜索如何颠覆传统检索方式,从实体识别、向量召回到大模型加持的语义理解,全面解析携程在智能搜索上的技术路径与实践经验。
8/5/2025 9:28:08 AM
万亿参数狂欢!一文刷爆2025年七大顶流大模型架构
从最初的GPT架构问世以来,已经过去七年了。 回顾2019年GPT-2,再看2024-2025年的DeepSeek-V3和Llama 4,你会发现,这些模型的结构依然惊人地相似。 当然,位置嵌入已从绝对位置编码演变为旋转位置编码(RoPE),多头注意力(Multi-Head Attention)大多被分组查询注意力(Grouped-Query Attention)取代,更高效的SwiGLU激活函数也逐渐取代了GELU。
8/4/2025 9:20:00 AM
Qwen3杀入全球前三,中国技术正式挑战OpenAI霸权
说实话,看到Qwen3 2507版本跻身全球AI模型前三的消息时,我第一反应是有点不敢相信。 毕竟在这个被OpenAI、Anthropic主导的AI世界里,国产模型能达到这个高度,确实让人意外。 但数据不会撒谎。
8/4/2025 9:19:06 AM
阿丸笔记
吴恩达:中国将产生真正强大的AI公司,AGI更像营销而不是技术里程碑
刚刚吴恩达老师发了一篇推文,吴老师表达了对中国人工智能发展高度认可,并且认为虽然目前美国暂时领先,但中国的AI发展具有强大的可以超越美国的路径 ,吴老师还认为AGI更像是营销而不是技术突破,AGI没有终点线,中国半导体布局和开源人工智能最终将协同发展,再加上激烈的竞争环境,会产生真正强大的AI公司以下是吴老师推文原文转译:如今,中国已经有了一条在人工智能领域超越美国的路径。 尽管美国目前仍然领先,但中国在开放模型生态系统方面充满活力,并且在半导体设计和制造领域积极布局,已经展现出强大的发展势头。 初创企业的经验告诉我们,势头至关重要:即使现在公司规模较小,只要保持高速增长,几年后就可能变成无法阻挡的力量。
8/1/2025 9:30:00 AM
测试不同的RAG技术以找到最佳方案
检索增强生成(RAG)技术通过结合大型语言模型(LLMs)与外部数据检索能力,能够提供准确且富含上下文的答案。 无论是构建客户支持聊天机器人还是研究助手,RAG都能通过从数据库中提取相关信息来增强AI的性能。 然而,不同的RAG技术在性能上存在差异,选择最佳技术需要进行测试。
8/1/2025 3:20:00 AM
大模型之路
把指纹焊死在频率上:抗微调神经网络指纹的硬核方案来了
论文第一作者唐灵,张拳石老师课题组的博二学生。 今天要聊的是个硬核技术 —— 如何给神经网络刻上抹不掉的 "身份证"。 现在大模型抄袭纠纷不断,这事儿特别应景。
7/31/2025 9:42:57 AM
炮轰黄仁勋,决裂奥特曼!1700亿美元估值背后,硅谷最不好惹的AI狂人
Dario Amodei这位AI圈最敢说的大佬,因为家庭变故,找到了人生方向。 作为Anthropic的CEO,他在2025年简直是「火力全开」,与行业对手、政府官员以及公众关于AI的看法展开了激烈交锋。 他预测AI可能很快会淘汰50%的入门级白领工作,还在《纽约时报》上抨击了为期十年的AI监管禁令。
7/31/2025 9:07:00 AM
机器学习特征工程的最佳实践
特征工程是模型训练之前运行的关键过程,因为输入数据的质量直接决定了模型输出的质量。 虽然深度学习模型擅长从图像或文本等非结构化数据中自动学习特征,但明确的特征工程对于表格数据集仍然至关重要。 在本文中,云朵君将展示特征工程对回归任务的影响,特别关注具有混合数字、分类和基于时间的特征的大型表格数据集。
7/31/2025 1:22:00 AM
云朵君
告别大统一模型!预填充解码分离背后的技术哲学革命
说实话,最近看到一个技术思路的时候,我有点被震撼到了。 我们一直觉得,既然大语言模型这么厉害,那就应该用一个统一的大模型来处理所有事情——输入理解、上下文处理、token生成,全都交给一个模型搞定。 这听起来很符合"大力出奇迹"的思路。
7/31/2025 12:00:00 AM
阿丸笔记
国产AI新突破:Qwen思考166秒背后的技术野心
想象一下这个场景:你让AI画一只骑自行车的鹈鹕,其他模型可能会立刻给你一个结果,但有一个AI却开始了长达166秒的深度思考。 它在想什么? 鹈鹕的嘴巴应该怎么画?
7/28/2025 9:19:22 AM
阿丸笔记
港科大&北京人形提出LOVON:足式机器人开放世界全域目标追踪新范式!
本文一作彭道杰,香港科技大学广州在读博士生;共同一作曹嘉航,北京人形机器人创新中心实习生;共同一作张强香港科技大学广州在读博士生,北京人形机器人创新中心学术委员会主任;通讯导师马骏,香港科技大学广州&香港科技大学助理教授。 在复杂的开放环境中,让足式机器人像人类一样自主完成「先跑到椅子旁,再快速接近行人」这类长程多目标任务,一直是 robotics 领域的棘手难题。 传统方法要么局限于固定目标类别,要么难以应对运动中的视觉抖动、目标丢失等实时挑战,导致机器人在真实场景中常常「迷路」或「认错对象」。
7/25/2025 2:59:51 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
Stable Diffusion
AI for Science
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
百度
RAG
Sora
具身智能
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
架构
DeepMind
视觉
预测
Transformer
编程
生成式AI
伟达
AI模型
特斯拉
Copilot