AI在线 AI在线

AI

打破跨模态干扰,快手东北大学联合提出统一多模态框架,横扫多模态检索基准

多模态检索是信息理解与获取的关键技术,但其中的跨模态干扰问题一直是一大难题。 可行的解决办法是构建一种统一的多模态表示方式,为此,来自快手与东北大学的研究人员推出了多模态统一嵌入框架——UNITE。 UNITE的核心目标,就是构建一个能同时处理文本、图像、视频及其融合模态输入的统一嵌入器。
6/9/2025 8:50:00 AM

RLHF已死,RLVR引爆AGI革命!Claude 4核心成员万字对谈

在Dwarkesh Patel主持的节目中,Anthropic的Sholto Douglas、Trenton Bricken等人,一起讨论了Claude 4是如何思考的。 三人私交甚好,聊了2小时20多分钟,主要集中在4个话题:1. 过去一年中人工智能研究的变化;2.
6/9/2025 8:48:00 AM

扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升

本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。 朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。 该研究基于团队前期发布的 8B 扩散语言模型 LLaDA(国内率先做到真正可用的扩散语言模型,是后续很多研究的主干基础模型),探索了扩散语言模型的偏好对齐方法,提出了方差缩减的偏好优化方法 VRPO,并利用 VRPO 对 LLaDA 进行了强化对齐,推出了 LLaDA 1.5。
6/9/2025 8:47:00 AM

生图效果媲美GPT-4o,一键搞定各类视觉生成任务丨港科广&字节全新框架

图像生成、视频创作、照片精修需要找不同的模型完成也太太太太太麻烦了。 有没有这样一个“AI创作大师”,你只需要用一句话描述脑海中的灵感,它就能自动为你搭建流程、选择工具、反复修改,最终交付高质量的视觉作品呢? 这一切,现在通过一个由港科大(广州)和字节联合出品的全新的开源框架——ComfyMind实现了。
6/9/2025 8:40:00 AM

图灵奖得主、AI教父Bengio:我改变了科研方向,哪怕与此前信念背离,也要尽己所能降低AI失控的灾难风险;AGI最快五年降临

编辑 | 云昭6月6日,年逾花甲的三大“AI教父”之一的Yoshua Bengio(小编心中的科研偶像之一),如约出现在2025智源大会上的现场荧幕中。 大师眼中的GPT究竟是什么样子? 我们又该打造怎样的AI?
6/9/2025 8:39:10 AM
云昭

你永远叫不醒装睡的大模型!多轮对话全军覆没,性能暴跌39%

ChatGPT将大模型技术推动到「对话」场景,直接引发了AI技术的爆炸式增长。 用户可以先提出一个粗糙的、不明确的问题,再根据模型的回答逐步完善指令、补充细节,多轮对话也催生出「跟AI打电话」等有趣的应用设计。 不过,现有的大模型性能评估基准仍然是基于单轮对话机制,输入的指令也更长,信息更完善,其在真实场景中多轮对话的性能仍然没有得到很好地评估。
6/9/2025 8:30:00 AM

CS专业爆冷,失业率飙至全美第七!毕业生狂卷4年,投1000份简历换0 offer

谁能想到,曾经最受欢迎的大学专业,如今却拥有最高的失业率? 曾经红极一时的CS,时常被评为最受大学生和应届毕业生欢迎的专业。 但是如今,它却成了所有研究领域中失业率最高的专业之一。
6/9/2025 8:28:00 AM

人工智能和知识图谱七:知识图谱在人工智能系统中的优势

知识图谱融入 AI 解决方案后,将带来诸多优势。 这些优势涵盖互操作性、查询功能等技术改进以及可解释性、可信度、减少开发工作量等更高层次的关注点。 本文概述了知识图谱的主要优势,以及它如何补充机器学习模型,助力打造更值得信赖的 AI。
6/9/2025 3:00:00 AM
晓晓

谷歌CEO劈柴震撼预言:2030年AI直逼超人智能,80亿人认知被颠覆

谷歌CEO劈柴在近期采访中提到,AI是人类将开发的影响最深远技术,比火或电更重要。 它的进步极快,能力上限未知,最独特的是AI能递归自我改进、自己创造和提升。 图片尤其是如果在AI研究领域达到超人水平,某天能比前一天更好地自我创造,这就像AlphaGo的第37步。
6/9/2025 2:15:00 AM
新智元

2025 生成式 AI 大棋局:全球数据报告里的趋势解读

大家好,我是肆〇柒。 今天,我们要深入探讨生成式 AI 如何重塑各行业版图。 这两天看到《AI Global Report: Global Sector Trends on Generative AI》,这份具有价值的报告,无疑是为我们提供了一份以数据为基础的指导。
6/9/2025 2:00:00 AM
肆零柒

0产品、0用户、0API!欧洲 AI 创企仅凭 1 段视频狂揽1300万刀

最近,在欧洲 AI 创业地图上,一笔 1300 万美元的种子轮融资格外醒目:没有发布产品、没有用户数据、甚至没有一行可供调用的 API,SpAItial,仅凭一段展示“文本生成 3D 房间”的短视频,就拿到了 Earlybird、Speedinvest 等顶级基金的下注。 这笔融资背后,是一个尚未成型、但注定重要的赛道:文本生成 3D 世界。 SpAItial 由图形学与 AI 研究者 Matthias Niessner 发起,他此前是 Synthesia 的联合创始人,也在慕尼黑工业大学长期从事视觉计算相关研究。
6/9/2025 2:00:00 AM

智能体开发实战|基于Dify+MCP实现通过微信发送天气信息给好友

前言AI智能体通过感知环境、自主决策和执行任务,突破传统大模型仅限于语言交互的局限。 例如,当用户指令“订一张明天去北京的机票”时,智能体不仅理解语义,还能自动调用航班查询接口、完成支付并同步至日程系统。 这种能力使其在客服、医疗、智能制造等领域展现出颠覆性潜力。
6/9/2025 1:00:00 AM
AI大模型应用开发

医疗保健领域的数字化转型:构建基于价值的医疗企业软件

2025年,医疗行业正经历着一场翻天覆地的变革,价值医疗(VBC)正逐步取代传统的按服务付费模式。 不同于以往仅奖励服务数量的旧模式,价值医疗更注重服务质量、患者治疗效果以及整个医疗系统的效率。 在这场变革的核心,是企业级医疗软件——这些强大的数字化工具旨在简化操作流程、提升护理协调性,并支持基于数据的决策制定。
6/9/2025 12:00:00 AM
D1net编译

苹果炮轰推理模型全是假思考!4个游戏戳破神话,o3/DeepSeek高难度全崩溃

苹果最新大模型论文,在AI圈炸开了锅。 有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。 这篇论文称推理模型全都没在真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。
6/8/2025 2:15:42 PM

六大模型决战高考数学新一卷:豆包、元宝并列第一,OpenAI o3竟惨败垫底

又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。 考试一结束,「高考数学」、「新一卷数学大题 难」等词条就火速冲上微博热搜,考生们在评论区集体「哀嚎」:「大题写到怀疑人生」、「选择填空送分,大题送命」。
6/8/2025 12:23:06 PM
机器之心

英国法院警告:律师若引用虚假的 AI 生成内容,可能面临严厉处罚

英格兰和威尔士高等法院警告律师,AI工具如ChatGPT生成的法律研究可能包含虚假信息,需核查准确性。法官维多利亚・夏普指出,律师有义务确保引用信息的真实性,否则可能面临严厉制裁。#AI法律风险# #律师职业规范#
6/8/2025 8:37:11 AM
远洋

具身智能最权威的一场圆桌!王兴兴回应质疑:当AI和具身智能到达某一阶段,机器人一定能打格斗!机器人届的格斗冠军和马拉松冠军都来了

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)宇树、银河通用、穹彻智能……当国内顶尖的机器人玩家同框,能碰撞出什么样的火花? 在今天智源做的AI春晚上,搞了一个很炸裂的“具身智能会客厅”,请来了王兴兴、熊友军、王鹤等顶尖大佬,分享最新进展和自己对行业的判断和洞察。 会上,王兴兴首次回应了机器人格斗“秀肌肉”的质疑,他表示格斗的关键在于动作的演示:因为我们公司终极目标还是希望机器人是干活的,无论是家里还是工厂。
6/6/2025 6:42:45 PM
伊风

​Snap 推出 Lens Studio iOS 和网页应用,简化 AR 镜头创作流程

Snap 公司近日宣布推出全新的 Lens Studio iOS 应用和网页工具,这一举措旨在让更多人轻松创建增强现实(AR)镜头。 通过这些新工具,用户可以使用文本提示和简单的编辑工具,快速生成自己的 AR 效果,增添个人化的元素。 新推出的 Lens Studio 应用程序允许用户生成 AI 效果、添加个人的 Bitmoji 形象,并浏览流行模板,以便自定义自己的 AR 镜头。
6/6/2025 5:00:55 PM
AI在线