AI
AI危险检测再进化!三层级解析长视频异常,各种时序粒度均有明显优势 | CVPR HighLight
多模态视频异常理解任务,又有新突破! “异常理解”是指在视频监控、自动驾驶等场景中,利用模型发现视频中的异常内容,从而预判危险,以便及时做出决策。 来自华中科大等机构的研究人员,提出了新的视频异常理解模型Holmes-VAU,以及相关数据集。
"是我创造了第一个LLM"!Kaggle前首席科学家一句话引发AI学术圈考古行动
论如何在技术圈争论中一句话噎到对方:哥们,是我创造了第一个大语言模型。 发言者Jeremy Howard为澳大利亚昆士兰大学名誉教授、曾任Kaggle创始总裁和首席科学家,现answer.ai与fast.ai创始人,。 事情的起因是有人质疑他最近的项目llms.txt在帮助大模型爬取互联网信息上并没太大作用,从而引发了这段争论,迅速引起众人围观。
MySQL遇到AI:字节跳动开源 MySQL 虚拟索引 VIDEX
虚拟索引技术(virtual index,也称为 hypothetical index)在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。 简单来说,虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建索引,仅基于统计信息即可精准模拟不同索引方案对查询计划的优化效果。 由于虚拟索引的创建/删除代价极低,使用者可以大量创建和删除索引、反复推演,确定最有效的索引方案。
首个AI科学家发论文进ICLR!得分6/7/6,从选题到实验全程零人工,连GitHub代码库都是AI写的
嚯! 完全由AI生成的论文,通过顶会ICLR评审? !
生图加入CoT,性能提升80%!微软港中文打造天才画手
AI绘画火爆的当下,大家都有过这样的体验:满心欢喜地输入一段描述,满心期待着生成超酷炫的图像,结果AI给出的作品却差强人意,不是没get到重点,就是细节各种「翻车」。 今天要介绍的ImageGen-CoT技术,就像是给AI绘画开了「外挂」,让它变得超智能,创作更轻松! 来自微软和港中文的华人研究者提出了ImageGen-CoT,用思维链(CoT)推理提升文本到图像上下文学习能力。
知识图谱驱动!港大LightRAG终结企业碎片化检索,效率飙升200%
1、前言当前的检索增强生成(RAG)技术在实际应用中面临若干挑战。 传统的RAG采用基于向量的扁平化数据表示,难以有效建模实体之间的复杂语义关系,导致在处理复杂领域知识时检索精度不足。 此外,传统RAG在多实体关联推理中容易出现逻辑断层,且全量更新机制使得知识库的维护成本随数据规模指数增长。
三星进军 AI 机器人领域,Ballie 本周公开亮相
Ballie 是一款深度集成 SmartThings 平台的 AI 伴侣机器人,配备摄像头和迷你投影仪,能够在家中跟随用户,它不仅能够提供天气预报、播放电影、展示三星健康数据,还能协助管理购物清单、控制智能家居设备等。
一文彻底搞懂 MCP:AI 大模型的标准化工具箱
MCP 最近在 AI 领域 引发了 广泛关注,特别是在 海外各大社区 中,大家热烈讨论,热度相当高。 我打开了 Google Trends[1],这是一个专门用于查看全球热点趋势的网站。 图片输入关键词后,可以查看其热度变化。
深度干货:DeepSeek+Dify强强联合,打造企业专属私有化AI知识库
在数字化转型的浪潮中,人工智能正以前所未有的速度渗透到企业运营的各个环节。 尤其对于算力需求旺盛的企业,例如那些关注Nvidia GPU、A800、H100等高性能计算资源的公司,以及积极探索AI Agent(如AutoGen、Devin AI)和低代码平台潜力的组织,如何安全、高效地利用AI提升内部知识管理和对外服务能力,成为其保持竞争力的关键。 本文将深入探讨如何通过DeepSeek强大的语言模型,结合Dify便捷的AI应用开发平台,构建一个私有化部署的企业知识库,为企业带来更智能、更安全、更高效的知识管理体验。
CEO们认为AI可以比董事会成员制定更好的商业计划
一些AI专家并不像CEO那样,对这项技术能为他们的业务提供战略见解抱有信心,但其他人表示,AI正朝着这个方向迈进。 绝大多数CEO认为,AI已经发展得足够先进,可以开始接手C级高管和董事会成员所承担的一些职责。 在接受AI平台提供商Dataiku调查的CEO中,有94%的人认为,智能体可以提供与人类董事会成员相似或更好的商业决策建议。
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
就在刚刚,每年都备受瞩目的斯坦福AI指数报告,重磅发布了! 这份报告由斯坦福大学以人为本AI研究员发布,代表着每年AI领域最核心和前沿的动向总结。 今年,这份报告长达456页,抛出不少惊人观点。
PandaAI:一个基于AI的对话式数据分析工具
PandaAI 是一个基于 Python 开发的自然语言处理和数据分析工具,支持问答式(ChatGPT)的数据分析和报告生成功能。 PandaAI 提供了一个开源的框架,主要核心组件包含用于数据处理的数据准备层(Pandas)以及实现 Text2SQL 功能的自然语言接口。 数据源PandaAI 支持文件、数据库以及大数据平台等多种数据源连接,包括 Excel、CSV、MySQL、PostgreSQL、Oracle、Microsoft SQL Server、Databricks、Redshift、Snowflake、ClickHouse、Supabase、BigQuery、Salesforce 等。
AI时代下数字化转型最大陷阱!是没数据,还是没用对数据?
许多企业谈起数字化转型,第一反应就是"我们没有数据基础"。 真相是,企业不缺数据,缺的是对数据价值的挖掘。 企业只要存续经营,就在不断产生大量数据,这些未被充分利用的数据就像沉睡的金矿,等待被唤醒创造价值...数据早已存在,只是未被唤醒企业数据无处不在。
ChatGPT的危险之处:你永远不应该告诉AI机器人的五件事
但这个征服世界的大型语言模型聊天机器人被描述为一个“隐私黑洞”,人们担心它处理用户数据的方式,这甚至导致它在意大利被短暂封禁。 它的创造者OpenAI毫不掩饰这样一个事实:任何输入的数据都可能不安全。 这些数据不仅可能被用于进一步训练其模型,从而可能暴露给其他用户,而且还可能被人工审核,以检查其是否符合使用规则。
奥特曼采访回应“偷走”吉卜力!GPT4o大爆炸;套壳OpenAI也能成为大生意;今年AI可以帮编程提效10倍!
整理 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)刚刚,奥特曼又有了一个新采访! 在这场访谈中,OpenAI CEO 奥特曼接受了印度博主兼开发者 Varun Mayya 的专访,聊到了多个当前 AI 技术从业者最关心的话题:包括最近火爆出圈的 GPT-4o 图像生成能力、Prompt Engineer 是否真的值得存在、Agent 的落地路径等等,甚至还有他本人对 AI 带来失业焦虑的思考。 画个重点,本次采访亮点有: GPT-4o爆火,“现在生成的图像数量远远超过了我原本以为互联网有的需求。
用于科研的AI:Nature教你如何选择正确地选择工具
编辑丨toileter人工智能(AI)的到来是一场革命。 随着现在越来越多的 AI 投入使用,虽然许多教育工作者和学术机构最初对此持谨慎态度,但学术界似乎越来越愿意允许学生学生进行这种尝试。 Nature 期刊为此探讨了如今学者与学生们如何利用 AI 进行实验的简化。
AI让材料科学开挂了!这场闭门会就缺你这枚“关键队友”
人工智能与材料科学的交叉融合正驱动全球科技与产业格局革新。 为了推动 AI 驱动材料科学的技术突破与产业落地,搭建跨领域沟通与资源对接的交流平台,4 月 11 日(本周五)下午,AI在线「智者」闭门会第二期以「人工智能驱动的材料革命」为主题,邀请创始人、技术高管、专家学者、投资人一起聊聊 AI 材料的几个核心议题:生成式 AI 的材料设计新范式物理驱动的 AI 模型增强AI 如何助力材料生产中的工艺优化AI 在通用材料的应用案例与场景探讨AI 在半导体材料、新能源材料应用案例与场景探讨如何打破从「实验室突破」到「工业落地」的鸿沟如何报名为了保证交流质量,本次研讨会将控制在 12 人以内。 目前已经邀请到科思创、海辰储能、幻量科技、智化科技、深度原理、苏州实验室、启高资本等十余位 AI 材料领域的创始人、技术高管、合伙人。
Llama 4在测试集上训练?内部员工、官方下场澄清,LeCun转发
Llama 4 这么大的节奏,Meta 终于绷不住了。 本周二凌晨,Meta Gen AI 团队负责人发表了一份澄清说明(针对外界质疑「在测试集上训练」等问题),大佬 Yann LeCun 也进行了转发。 很高兴能让大家用上 Llama 4,我们已经听说人们使用这些模型取得了很多出色的成果。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉