资讯列表
Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源
深夜,沉寂已久的Kimi突然发布了新模型——开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。 参数量只有72B,但编程水平比最新的DeepSeek-R1还强,和闭源模型比较也表现优异。 有网友看到后表示,感觉月之暗面的实力被低估了,其水平应该比xAI强。
6/17/2025 9:07:24 AM
人类飞机上吵架看呆袋鼠」刷屏全网,7000万人被AI耍了
200 多年前,曹雪芹在《红楼梦》中写下这样一句话:假作真时真亦假,无为有处有还无。 翻译成大白话就是,当虚假被当作真实时,真实也会被视为虚假;当虚无被强行视为存在时,存在也会消解为虚无。 万万没想到,放在今天的 AI 语境下,这句古话竟精准地映照了现实。
6/17/2025 9:05:00 AM
刚刚,谷歌AI路线图曝光:竟要抛弃注意力机制?Transformer有致命缺陷!
就在最近,谷歌未来的AI路线图曝光! 谷歌产品负责人Logan Kilpatrick在AI工程师世界博览会的演讲中,介绍了Gemini模型的未来。 在未来,Gemini的全模态是重点,模型正在逐步变成智能体,推理能力还会持续扩展。
6/17/2025 9:05:00 AM
搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好
当前,Agentic RAG(Retrieval-Augmented Generation)正逐步成为大型语言模型访问外部知识的关键路径。 但在真实实践中,搜索智能体的强化学习训练并未展现出预期的稳定优势。 一方面,部分方法优化的目标与真实下游需求存在偏离,另一方面,搜索器与生成器间的耦合也影响了泛化与部署效率。
6/17/2025 9:04:33 AM
阿里巴巴发布 Qwen3 升级版,适配苹果 MLX 架构
阿里巴巴集团宣布推出其旗舰人工智能模型 Qwen3的全新升级版,该版本已成功适配苹果的 MLX 架构,这意味着苹果智能(Apple Intelligence)在中国市场的推出似乎指日可待。 根据阿里巴巴的消息,新的 Qwen3版本具备更强的性能,支持119种语言和方言,进一步提升了用户体验。 在此前的 iOS18.4版本中,苹果智能已经开始支持简体中文,但其生成式人工智能功能在中国大陆尚未正式上线。
6/17/2025 9:02:17 AM
AI在线
谷歌被指用 ChatGPT 提升 Gemini,Scale AI 坚决否认
根据近期的报道,谷歌在生成式人工智能领域的竞争似乎正面临新的挑战。 尽管谷歌拥有强大的云计算能力和丰富的人才资源,但在与微软和 OpenAI 的竞争中,谷歌常常被视为处于劣势地位。 微软首席执行官萨提亚・纳德拉曾指出,谷歌在人工智能领域错失了良机,这引发了谷歌母公司 Alphabet 的首席执行官桑达尔・皮查伊的强烈回应。
6/17/2025 9:02:17 AM
AI在线
2天完成人类12年工作,AI自动更新文献综述,准确率碾压人类近15%
当碳基生物还在为写文献综述,打开了一百个浏览器窗口时,隔壁AI已经卷起来了。 (doge)两天完成人类12年工作——医学研究领域中,系统评价(SRs)作为临床决策的黄金标准,平均耗时超过16个月,花费10万美元以上,且容易延长无效或有害治疗方法的使用。 于是多伦多大学、哈佛医学院等机构联合开发了AI端到端工作流程——otto-SR。
6/17/2025 9:00:00 AM
一个数据集,一年产稿7876篇!AI强力加持,垃圾论文海量爆发
假如你是一位科研期刊的编辑,每天打开邮箱,迎接的却是一堆似曾相识的论文。 它们主题各异,数据整齐,措辞流畅,但总有种让人不安的「模板感」。 这可不是一个瞎编的场景,而是2024年发生在《Scientific Reports》编辑Matt Spick身上的真实经历。
6/17/2025 8:53:00 AM
Claude与人类共著论文,苹果再遭打脸!实验黑幕曝光
几天前,苹果怒斥大模型根本不会推理论文,引发全网无数讨论与争议。 在许多人看来,没有站在AI前沿的人, 却质疑当今最领先推理模型o3-mini、DeepSeek-R1推理能力,实在没有说服力。 论文一出,备受质疑。
6/17/2025 8:52:00 AM
MIT工科生跨界AI,独作论文登Nature:只需3.5小时修复600年前名画
MIT理工男跨界艺术,一不小心就以一篇独作论文登上Nature? 由他设计的AI算法,将原本需要数月/数年才能搞定的名画修复工作,极限压缩至几小时。 Alex Kachkine,打破画作修复只能对原作数字扫描品进行“缝缝补补”的传统艺能,提出一种“以数字方式修复一幅画,并在物理上实现效果”的全新方法。
6/17/2025 8:50:00 AM
4B Qwen3逆袭671B DeepSeek!字节DAPO微调方法这么猛的吗
4B小模型极限在哪里? 最新模型Jan-nano引起热议,它在智能体任务上超过671B的最新版DeepSeek-V3 0528,在SimpleQA基准上获得80.7分。 先来看一下它的实际表现,包括两个任务:对研究某公司目前的扩张情况,该公司的扩张正威胁着另一家公司的市场份额,并撰写一份可能影响金融公司尽职调查流程的MBA水平报告。
6/17/2025 8:45:00 AM
国内首个人形机器人全产业链专业展 6 月 20 日在杭州召开,特斯拉、宇树参展
国内首个人形机器人全产业链专业展6月20日-22日在杭州召开,特斯拉、宇树等300家企业参展,展示仿生驱动、具身智能等前沿技术。#人形机器人##AI技术#
6/17/2025 8:14:00 AM
浩渺
谷歌被曝用 ChatGPT 训练 Gemini,Scale AI 否认
有文件显示谷歌承包商或用 ChatGPT 训练改进 Bard(现谷歌 Gemini),Scale AI 否认。同时,Meta 拟 143 亿美元部分收购 Scale AI,谷歌不满或终止合作。#谷歌 #Gemini #ChatGPT
6/17/2025 8:11:50 AM
远洋
为 Apple Intelligence 入华铺路?阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版
阿里巴巴推出Qwen3升级版,兼容苹果MLX架构,苹果智能中国上线指日可待。该模型支持119种语言,性能优于前代。iOS 18.6或向中国用户提供苹果智能预览。#AI技术##苹果智能#
6/17/2025 7:53:02 AM
远洋
彻底解决Docker镜像无法下载
前言Docker是一个开源容器化平台,它的核心作用是通过容器技术将应用程序及其依赖环境打包成一个轻量级、可移植的单元,从而简化开发、部署和运维流程。 例如我们可以通过Docker轻松部署Dify社区版,帮助开发者和企业快速构建、部署及管理生成式AI应用。 由于众所周知的限制,国内开发者访问Docker Hub面临诸多不便,且多个国内镜像源陆续出现了无法使用的情况。
6/17/2025 6:40:45 AM
AI大模型应用开发
DouBao large model evolves again! Global leading AI Agent applications accelerate落地!
Recently, the DouBao large language model has welcomed its brand new version 1.6, marking another leap in its comprehensive capabilities. In core areas such as reasoning, mathematics, and instruction-following, DouBao 1.6 has achieved significant performance improvements while greatly reducing the barriers for user adoption, driving the rapid application of AI Agents in industries such as consumer electronics, automobiles, and finance.According to the latest released data, DouBao 1.6 has ranked among the global leaders in complex reasoning, competitive-level mathematics, multi-turn dialogue, and instruction-following tests. For instance, in the evaluation based on Beijing Haidian District's simulated college entrance exam papers, DouBao 1.6 improved the science score by 154 points and the liberal arts score by 90 points compared to last year.
6/17/2025 6:01:36 AM
AI在线
视频版AI换衣框架MagicTryOn,基于Wan2.1视频模型
在现代时尚产业中,视频虚拟试穿(Video Virtual Try-On, VVT)逐渐成为了用户体验的重要组成部分。 这项技术旨在通过模拟服装在视频中与人体动作的自然互动,展现出服装在动态变化中的真实效果。 然而,目前的 VVT 方法仍然面临着空间时间一致性和服装内容保留等多重挑战。
6/17/2025 3:01:36 AM
AI在线
工业异常检测新突破,复旦等多模态融合监测入选CVPR 2025
多模态融合检测,工业异常检测领域新突破! 复旦大学、荣旗工业科技、腾讯优图实验室 上海交通大学、上海海洋大学等机构联合发布高精度多模态数据集Real-IAD D³,并基于此数据集提出了一种创新的多模态融合检测方法。 相关成果已被计算机视觉顶会CVPR 2025收录。
6/17/2025 2:25:00 AM