资讯列表
特朗普「全政府AI计划」竟在GitHub泄密!或于7月4日「独立日」上线
最新消息:再过不到一个月,特朗普政府就要启动一个超级计划,把AI推广到整个联邦政府! 美国总务管理局(GSA,联邦政府的采购部门)和它的技术转型服务(TTS)小组正在搞一个叫ai.gov的网站,目标是通过AI加速政府创新。 这消息是从GitHub上一个代码仓库里挖出来的,可惜发邮件一问,这仓库链接就无法显示了。
6/17/2025 9:19:16 AM
鹅厂实习生血泪贴:Agent/RAG 黑科技,真相竟是这样!
作者 | 33号实验室/knnwang被Agent/RAG吊打? 你缺的不是智商,是这篇文章! 亲历鹅厂IEG/WXG项目实战,大三菜鸟用血泪debug记录, 撕开AI基石真面目 → 黑科技本质 = ______!
6/17/2025 9:15:07 AM
腾讯技术工程
亚马逊码农噩梦来袭!沦落「仓库工人」,每天流水线分拣「AI代码」
未来的编程世界,会是灵感与效率的完美平衡,还是流水线式的代码工厂? 最近,亚马逊的软件工程师们发现,他们的日常工作正在发生微妙却深刻的变化。 AI工具被广泛引入,从代码生成到调试优化,程序员被要求以更快的速度交付成果。
6/17/2025 9:11:59 AM
刚刚,LMArena最新模型榜单出炉!DeepSeek-R1网页编程能力赶超了Claude Opus 4
在开源模型领域,DeepSeek 又带来了惊喜。 上个月 28 号,DeepSeek 来了波小更新,其 R1 推理模型升级到了最新版本(0528),并公开了模型及权重。 这一次,R1-0528 进一步改进了基准测试性能,提升了前端功能,减少了幻觉,支持 JSON 输出和函数调用。
6/17/2025 9:09:00 AM
Meta AI 应用新增隐私警告:避免分享个人或敏感信息
Meta更新AI应用,为“发布到信息流”按钮新增免责声明,提醒避免分享敏感信息。此前该应用信息流存在过度分享隐私问题遭批评。更新后分享有警告,信息流仅展示AI生成内容,变化情况未知。#MetaAI#
6/17/2025 9:08:13 AM
远洋
Nature警告:AI「数据饥渴症」引爆学术宕机潮!90%知识库濒临崩盘
假如一个平日里宁静的图书馆,突然涌入一大群不速之客,他们不阅览、不沉思,只是一味地疯狂复印每一本书的每一页。 这喧嚣吵闹的场面,怎能不打扰那些正埋首书海、专心阅读的人们呢? 如今,学术网站正遭遇类似的「数字入侵」。
6/17/2025 9:08:00 AM
Kimi新模型拿下代码开源SOTA,仅仅72B,发布即开源
深夜,沉寂已久的Kimi突然发布了新模型——开源代码模型Kimi-Dev,在SWE-bench Verified上以60.4%的成绩取得开源SOTA。 参数量只有72B,但编程水平比最新的DeepSeek-R1还强,和闭源模型比较也表现优异。 有网友看到后表示,感觉月之暗面的实力被低估了,其水平应该比xAI强。
6/17/2025 9:07:24 AM
刚刚,谷歌AI路线图曝光:竟要抛弃注意力机制?Transformer有致命缺陷!
就在最近,谷歌未来的AI路线图曝光! 谷歌产品负责人Logan Kilpatrick在AI工程师世界博览会的演讲中,介绍了Gemini模型的未来。 在未来,Gemini的全模态是重点,模型正在逐步变成智能体,推理能力还会持续扩展。
6/17/2025 9:05:00 AM
人类飞机上吵架看呆袋鼠」刷屏全网,7000万人被AI耍了
200 多年前,曹雪芹在《红楼梦》中写下这样一句话:假作真时真亦假,无为有处有还无。 翻译成大白话就是,当虚假被当作真实时,真实也会被视为虚假;当虚无被强行视为存在时,存在也会消解为虚无。 万万没想到,放在今天的 AI 语境下,这句古话竟精准地映照了现实。
6/17/2025 9:05:00 AM
搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好
当前,Agentic RAG(Retrieval-Augmented Generation)正逐步成为大型语言模型访问外部知识的关键路径。 但在真实实践中,搜索智能体的强化学习训练并未展现出预期的稳定优势。 一方面,部分方法优化的目标与真实下游需求存在偏离,另一方面,搜索器与生成器间的耦合也影响了泛化与部署效率。
6/17/2025 9:04:33 AM
谷歌被指用 ChatGPT 提升 Gemini,Scale AI 坚决否认
根据近期的报道,谷歌在生成式人工智能领域的竞争似乎正面临新的挑战。 尽管谷歌拥有强大的云计算能力和丰富的人才资源,但在与微软和 OpenAI 的竞争中,谷歌常常被视为处于劣势地位。 微软首席执行官萨提亚・纳德拉曾指出,谷歌在人工智能领域错失了良机,这引发了谷歌母公司 Alphabet 的首席执行官桑达尔・皮查伊的强烈回应。
6/17/2025 9:02:17 AM
AI在线
阿里巴巴发布 Qwen3 升级版,适配苹果 MLX 架构
阿里巴巴集团宣布推出其旗舰人工智能模型 Qwen3的全新升级版,该版本已成功适配苹果的 MLX 架构,这意味着苹果智能(Apple Intelligence)在中国市场的推出似乎指日可待。 根据阿里巴巴的消息,新的 Qwen3版本具备更强的性能,支持119种语言和方言,进一步提升了用户体验。 在此前的 iOS18.4版本中,苹果智能已经开始支持简体中文,但其生成式人工智能功能在中国大陆尚未正式上线。
6/17/2025 9:02:17 AM
AI在线
2天完成人类12年工作,AI自动更新文献综述,准确率碾压人类近15%
当碳基生物还在为写文献综述,打开了一百个浏览器窗口时,隔壁AI已经卷起来了。 (doge)两天完成人类12年工作——医学研究领域中,系统评价(SRs)作为临床决策的黄金标准,平均耗时超过16个月,花费10万美元以上,且容易延长无效或有害治疗方法的使用。 于是多伦多大学、哈佛医学院等机构联合开发了AI端到端工作流程——otto-SR。
6/17/2025 9:00:00 AM
一个数据集,一年产稿7876篇!AI强力加持,垃圾论文海量爆发
假如你是一位科研期刊的编辑,每天打开邮箱,迎接的却是一堆似曾相识的论文。 它们主题各异,数据整齐,措辞流畅,但总有种让人不安的「模板感」。 这可不是一个瞎编的场景,而是2024年发生在《Scientific Reports》编辑Matt Spick身上的真实经历。
6/17/2025 8:53:00 AM
Claude与人类共著论文,苹果再遭打脸!实验黑幕曝光
几天前,苹果怒斥大模型根本不会推理论文,引发全网无数讨论与争议。 在许多人看来,没有站在AI前沿的人, 却质疑当今最领先推理模型o3-mini、DeepSeek-R1推理能力,实在没有说服力。 论文一出,备受质疑。
6/17/2025 8:52:00 AM
MIT工科生跨界AI,独作论文登Nature:只需3.5小时修复600年前名画
MIT理工男跨界艺术,一不小心就以一篇独作论文登上Nature? 由他设计的AI算法,将原本需要数月/数年才能搞定的名画修复工作,极限压缩至几小时。 Alex Kachkine,打破画作修复只能对原作数字扫描品进行“缝缝补补”的传统艺能,提出一种“以数字方式修复一幅画,并在物理上实现效果”的全新方法。
6/17/2025 8:50:00 AM
SFT+RL双管齐下:ReasonGen-R1如何破解文生图「指令不遵」难题?
近年来,链式推理和强化学习已经被广泛应用于大语言模型,让大语言模型的推理能力得到了显著提升。 然而,在图像生成模型中,这种成功经验尚未得到充分探索。 图像生成模型往往直接依据给定文本生成图像,缺乏类似人类创作过程中的推理,导致生成的图像在语义遵循上仍有一定局限。
6/17/2025 8:47:00 AM
4B Qwen3逆袭671B DeepSeek!字节DAPO微调方法这么猛的吗
4B小模型极限在哪里? 最新模型Jan-nano引起热议,它在智能体任务上超过671B的最新版DeepSeek-V3 0528,在SimpleQA基准上获得80.7分。 先来看一下它的实际表现,包括两个任务:对研究某公司目前的扩张情况,该公司的扩张正威胁着另一家公司的市场份额,并撰写一份可能影响金融公司尽职调查流程的MBA水平报告。
6/17/2025 8:45:00 AM