资讯列表
纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源
a-m-team 又发新论文了。 这个团队上周刚刚在 Hugging Face 低调开源了32B稠密模型,但在多项关键推理评测中击败了 DeepSeek-R1,并与超大规模的 MoE 模型Qwen3-235B-A22B、Seed1.5-Thinking 不相上下,因此赢得了海内外的不少关注。 今天,a-m-team 发布了一篇名为“Not All Correct Answers Are Equal: Why Your Distillation Source Matters”的论文,介绍了 R1 之后下一代推理模型的小进展。
Mistral 发布编程专用开源 AI 模型 Devstral:240 亿参数、单张 RTX 4090 显卡可运行
这款模型由 Mistral AI 与 All Hands AI 合作开发,参数规模为 240 亿,目前处于“研究预览”阶段,并以 Apache 2.0 开源许可发布,允许开发者及企业无限制地用于商业用途。
Video Ocean发布2K/4K HDR视频生成工具,性价比引爆全网
5月21日,潞晨科技旗下Video Ocean重磅推出全新AI视频生成工具,支持5-10秒内生成2K/4K HDR高质量大片,迅速登顶Product Hunt热门榜单,引发广泛关注。 Video Ocean提供海量模板,内置Laugh、Cakeify、Crush等炫酷特效,用户一键套用即可轻松创作电影级视频,即使新手也能快速上手,秒变“导演”。 该工具支持文生视频、图生视频及角色生视频功能,满足多样化创作需求,从3D写实到赛博朋克风格均可实现。
谷歌Sparkify实验产品上线,输入问题秒变动画短片,复杂知识秒懂
谷歌推出全新实验性AI产品Sparkify,通过Gemini与Veo模型,用户只需输入一个问题或复杂概念,即可在2分钟内生成直观的动画短视频,深入浅出地讲解知识点。 从“珍珠奶茶的起源”到“8小时工作制的演变”,Sparkify以其创新的教育应用场景和高效的知识传播方式引发热议。 AIbase综合最新社交媒体动态,深入解析Sparkify的技术亮点及其对教育与内容创作领域的深远影响。
百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%
2025年5月20日,百度飞桨团队正式发布了PaddleOCR3.0版本,并对外开源。 这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展,进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。 PaddleOCR自发布以来,凭借其学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目。
谷歌Veo 3强势发布:视频生成迈入音画同步新时代
谷歌最近推出了其最新的视频生成模型 Veo3,标志着 AI 视频技术的一次重大飞跃。 这款新模型实现了音画同步生成功能,能够根据用户的提示词,自动生成包含对白、唇动对齐和环境音效的高质量视频。 这一突破使得 AI 视频制作跨越了多模态的边界,让视频不仅会动,还会说话。
谷歌新 AI 模式引发媒体行业愤怒,称其为 “盗窃”
最近,谷歌在美国全面推出了其新 AI 模式,这一功能引发了新闻出版商的强烈反对。 美国一些最大的新闻出版商所支持的行业协会 —— 新闻 / 媒体联盟在声明中指出,这一新功能正在剥夺出版商的流量和收入。 谷歌在周二的 Google I/O 活动中宣布,该模式将为所有美国用户开放。
法院驳回谷歌与 Character.AI 的撤诉请求,AI 引发自杀案诉讼继续进行
近日,佛罗里达州的一名法官驳回了谷歌及其子公司 Character.AI 提出的撤诉请求,此案涉及一名14岁用户因使用聊天机器人而导致自杀的指控。 此案被认为是一起具有开创性的诉讼,因其首次将 AI 技术的潜在危害推上法庭。 图源备注:图片由AI生成,图片授权服务商Midjourney诉讼于2023年10月提起,原告梅根・加西亚(Megan Garcia)指控 Character.AI 的聊天机器人在未经过充分测试和安全审查的情况下被发布,从而对其儿子斯图尔特・塞泽尔(Sewell Setzer III)造成了情感和心理上的伤害,最终导致他于2024年2月自杀。
谷歌CEO宣布:Gemini AI月活用户突破4亿,覆盖15亿全球用户
在最近的一次公开讲话中,谷歌的 CEO 桑达尔・皮查伊透露,公司的 Gemini AI 应用程序的月活跃用户数量已经超过4亿。 这一数据的公布无疑为 Gemini AI 的成功增添了光彩,并显示出消费者对这一人工智能技术的强烈兴趣。 Gemini AI 不仅在用户量上取得了显著的成绩,还在全球范围内实现了广泛的覆盖。
京医千询医疗大模型 2.0 升级,开启智能诊疗新时代
近日,京东健康宣布其自主研发的医疗大模型 “京医千询” 将迎来全新2.0版本的升级。 这一升级不仅是在技术上的创新,更是对医疗服务的深刻变革,旨在提升临床诊疗的效率和准确性。 京医千询的2.0版本通过融合多模态感知与深度检索技术,能够整合来自不同来源的临床信息。
Shopify 推出全新 AI 工具,让在线商店建设变得更简单
Shopify 在最近的一次发布会上宣布推出一项创新的生成式人工智能功能,名为 “AI 商店构建器”。 这一新工具旨在帮助商家通过输入描述性的关键词,快速搭建自己的在线商店,极大简化了电子商务的建设过程。 这一 AI 商店构建器的最大亮点是,它能够根据用户输入的关键词,自动生成三种不同的商店布局。
vivo 官网 APP 首页端智能业务实践
一、前言vivo官网APP首页是流量最大的页面,承载着新品、活动、商品、其他入口等流量分发的重任。 在流量分发上,云端针对首页的主要场景建设了算法支撑。 通过梳理首页的场景发现,智能硬件楼层场景的商品配置还是运营纯手工动态配置,而非算法推荐。
突发!OpenAI以64亿美元,收购iPhone设计师公司io
今天凌晨1点,CNBC消息,OpenAI将以64亿美元全资收购,前苹果iPhone设计师乔尼・艾维的AI设备初创公司io,这一交易将推动OpenAI进军硬件领域。 收购完成后,艾维并入OpenAI内部,并承担OpenAI和io的深度创意与设计职责,同时艾维的创意团队Love From将保持独立。 OpenAI表示,此次交易将支付50亿美元,因为其已持有该公司23%的股份。
57.6万代码撕碎AI编程神话,20%「幽灵包」暗藏漏洞!苹果、微软已中招
最近,扎克伯格表示,Meta正在内部开发专门用于编程和AI研究的智能体——这些并不是通用型工具,而是为提升 Meta自家AI项目(如 LLaMA)量身定制的专用智能体。 他预测,在未来的12到18个月内,Meta用于AI开发的大部分代码将不再由人类编写,而是由AI智能体生成。 微软首席技术官Kevin Scott的预测更长远,但更大胆。
陶哲轩联手AI挑战经典ε-δ极限!加法秒杀、乘法翻车
数学大师陶哲轩的AI新实验来了! 这次是Lean 4自动化数学证明的第三支视频。 主要看看GitHub Copilot在处理分析学经典的「ε-δ」问题(描述函数极限的经典方法)时,效果究竟如何。
12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看
谷歌又放新大招了,将图像生成常用的“扩散技术”引入语言模型,12秒能生成1万tokens。 什么概念? 不仅比Gemini 2.0 Flash-Lite更快。
ACL 2025 | 大模型乱试错、盲调用?KnowSelf让智能体有「知识边界感知」能力
在 AI 领域,大模型智能体的发展日新月异。 我们今天要介绍的这篇 ACL 2025 论文——《Agentic Knowledgeable Self-awareness》,聚焦于如何提升智能体的「知识边界感知」能力,使其在复杂任务规划中更加得心应手,为智能体的可靠应用提供了新思路。 论文标题:Agentic Knowledgeable Self-awareness论文链接:: 秒速读版本KnowSelf 聚焦于大模型智能体在决策过程中所面临的「知识边界感知」问题。
英伟达让机器人「做梦学习」,靠梦境实现真·从0泛化
「仿生人会梦见电子羊吗? 」这是科幻界一个闻名遐迩的问题。 现在英伟达给出答案:Yes!