理论
AI危险检测再进化!三层级解析长视频异常,各种时序粒度均有明显优势 | CVPR HighLight
多模态视频异常理解任务,又有新突破! “异常理解”是指在视频监控、自动驾驶等场景中,利用模型发现视频中的异常内容,从而预判危险,以便及时做出决策。 来自华中科大等机构的研究人员,提出了新的视频异常理解模型Holmes-VAU,以及相关数据集。
4/9/2025 9:25:00 AM
量子位
"是我创造了第一个LLM"!Kaggle前首席科学家一句话引发AI学术圈考古行动
论如何在技术圈争论中一句话噎到对方:哥们,是我创造了第一个大语言模型。 发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家,现answer.ai与fast.ai创始人,。 事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用,从而引发了这段争论,迅速引起众人围观。
4/9/2025 9:23:00 AM
量子位
MySQL遇到AI:字节跳动开源 MySQL 虚拟索引 VIDEX
虚拟索引技术(virtual index,也称为 hypothetical index)在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。 简单来说,虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建索引,仅基于统计信息即可精准模拟不同索引方案对查询计划的优化效果。 由于虚拟索引的创建/删除代价极低,使用者可以大量创建和删除索引、反复推演,确定最有效的索引方案。
4/9/2025 9:20:00 AM
字节跳动开源
首个AI科学家发论文进ICLR!得分6/7/6,从选题到实验全程零人工,连GitHub代码库都是AI写的
嚯! 完全由AI生成的论文,通过顶会ICLR评审? !
4/9/2025 9:12:28 AM
量子位
生图加入CoT,性能提升80%!微软港中文打造天才画手
AI绘画火爆的当下,大家都有过这样的体验:满心欢喜地输入一段描述,满心期待着生成超酷炫的图像,结果AI给出的作品却差强人意,不是没get到重点,就是细节各种「翻车」。 今天要介绍的ImageGen-CoT技术,就像是给AI绘画开了「外挂」,让它变得超智能,创作更轻松! 来自微软和港中文的华人研究者提出了ImageGen-CoT,用思维链(CoT)推理提升文本到图像上下文学习能力。
4/9/2025 9:10:00 AM
新智元
GPT-4o图像生成架构被“破解”了?自回归主干+扩散解码器,还有4o图像生成全面测评基准
GPT-4o图像生成架构被“破解”了! 最近一阵,“万物皆可吉卜力”让GPT-4o的图像生成功能一炮而红,人们随之好奇:4o图像生成的架构底层逻辑到底是什么? GPT-4o究竟强在哪?
4/9/2025 9:08:34 AM
知识图谱驱动!港大LightRAG终结企业碎片化检索,效率飙升200%
1、前言当前的检索增强生成(RAG)技术在实际应用中面临若干挑战。 传统的RAG采用基于向量的扁平化数据表示,难以有效建模实体之间的复杂语义关系,导致在处理复杂领域知识时检索精度不足。 此外,传统RAG在多实体关联推理中容易出现逻辑断层,且全量更新机制使得知识库的维护成本随数据规模指数增长。
4/9/2025 9:00:00 AM
后端小肥肠
三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭
当前大模型研究面临三大困境:算力垄断(顶尖成果集中于大厂)、成本壁垒(单次训练成本高,可能需要数千GPU小时)以及技术路径单一化(过度依赖单一模型的规模扩展)。 为突破这些限制,路由LLM(Routing LLM)范式应运而生——通过智能调度实现多个开源小模型的协同增效,以「组合创新」替代「规模竞赛」。 代码:: : level的MoE(Mixture-of-Experts),传统MoE通过在模型内部扩展专家网络(如稀疏激活的FFN层)提升性能,而路由LLM将完整LLM视为独立「专家」,通过预训练Router动态分配任务输入。
4/9/2025 9:00:00 AM
新智元
当 C# 遇上 ChatGPT:自动生成高质量单元测试代码实践
在软件开发的漫长旅程中,单元测试是确保代码质量的关键防线。 传统上,开发人员需要耗费大量时间和精力手动编写单元测试代码,这不仅考验开发者对业务逻辑的理解,还要求熟悉各种测试框架和技巧。 随着人工智能技术的飞速发展,ChatGPT等大型语言模型的出现为这一繁琐工作带来了新的解决方案。
4/9/2025 8:55:00 AM
conan
Git诞生20周年!大佬Linus十天写出的项目,彻底变革全球软件开发
转眼间Git诞生20周年了! 为了给Git庆生,如今鲜少公开露面的Linus罕见接受采访,更多幕后故事被更进一步展开。 2005年4月7日,Linux之父Linus Torvalds,提交了Git的首个版本。
4/9/2025 8:50:00 AM
量子位
一文彻底搞懂 MCP:AI 大模型的标准化工具箱
MCP 最近在 AI 领域 引发了 广泛关注,特别是在 海外各大社区 中,大家热烈讨论,热度相当高。 我打开了 Google Trends[1],这是一个专门用于查看全球热点趋势的网站。 图片输入关键词后,可以查看其热度变化。
4/9/2025 8:25:20 AM
程序员NEO
使用人工智能幻觉评估图像真实感
译者 | 朱先忠审校 | 重楼引言最近,俄罗斯的一项新研究提出了通过一种非常规方法来检测不切实际的人工智能生成的图像。 这种方法的主要思想是:不是通过提高大型视觉语言模型(LVLM)的准确性,而是通过有意利用它们产生幻觉的倾向。 这种新方法使用LVLM提取有关图像的多个“原子事实”,然后应用自然语言推理(NLI)系统地衡量这些陈述之间的矛盾,从而有效地将模型的缺陷转化为检测违背常识的图像的诊断工具。
4/9/2025 8:23:49 AM
朱先忠
Ollama与vLLM部署对比:哪个更合适?
Ollama:简单易用的LLM部署工具 Ollama以其简洁的安装和易于使用的特性而闻名。 其官方文档清晰易懂,即使是新手也能快速上手。 Ollama支持多种LLM模型,并提供便捷的命令行界面进行管理和运行。
4/9/2025 8:20:00 AM
耗子
如何使用生成式人工智能工具简化应用程序迁移
译者 | 李睿审校 | 重楼将遗留代码和应用程序迁移到现代系统面临风险并且耗时费力,然而这一过程通常是不可避免的。 本文将阐述利用生成式人工智能工具简化应用程序迁移的一些有效策略。 一项研究表明,在财富5000强公司使用的软件中,多达70%的软件都是在20年前开发的。
4/9/2025 8:14:03 AM
李睿
入门级开发人员过度依赖AI的风险
每当ChatGPT等工具出现故障时,软件开发人员离开办公桌、休息片刻或沮丧地靠在椅背上,都不足为奇。 对于技术领域的许多专业人士而言,AI辅助的编码工具已成为一种便利。 甚至像2025年3月24日发生的短暂故障,也可能使开发工作陷入停滞。
4/9/2025 8:10:00 AM
Andrada Fiscutean
深度干货:DeepSeek+Dify强强联合,打造企业专属私有化AI知识库
在数字化转型的浪潮中,人工智能正以前所未有的速度渗透到企业运营的各个环节。 尤其对于算力需求旺盛的企业,例如那些关注Nvidia GPU、A800、H100等高性能计算资源的公司,以及积极探索AI Agent(如AutoGen、Devin AI)和低代码平台潜力的组织,如何安全、高效地利用AI提升内部知识管理和对外服务能力,成为其保持竞争力的关键。 本文将深入探讨如何通过DeepSeek强大的语言模型,结合Dify便捷的AI应用开发平台,构建一个私有化部署的企业知识库,为企业带来更智能、更安全、更高效的知识管理体验。
4/9/2025 8:00:46 AM
康焕新
机器人、智能设备的边缘AI即将问世
Souped up工业机器人和智能设备将彻底改变我们在边缘侧使用AI的方式,并加深我们对云和数据中心的理解。 人形机器人、智能设备和自动驾驶经常被引为边缘侧利润丰厚的商业应用场景。 但边缘侧AI计算将把AI从数据中心和云中的集中式服务器中解放出来,部署到制造工厂、手术室以及整个市政中心,实时处理数据,更接近物联网设备、传感器和智能系统。
4/9/2025 8:00:00 AM
Paula Rooney
AI图片泛滥怎么管?OpenAI计划给AI图像添加水印
随着生成式人工智能的高速发展,AI图像正以前所未有的速度在网络上传播。 从AI创作“宫崎骏风格”动画图,到仿真度极高的商品广告照、新闻配图,普通用户只需输入一句话,便可秒产专业级画面。 这种“视觉洪流”的背后,是OpenAI等技术巨头不断推陈出新的图像生成模型——其中最先进的,莫过于不久前发布的ChatGPT-4o内嵌的ImageGen。
4/9/2025 8:00:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉