应用
遏制深度伪造:谷歌推出 SynthID Detector“AI 打假工具”
在 2025 年 I/O 开发者大会上,谷歌推出解决深度伪造(deepfake)和虚假信息问题,推出 SynthID Detector,是一款通过数字水印识别 AI 生成媒体的新工具。
纯蒸馏模型 SOTA 出现!直接 SFT 成本直降 50 倍,数据已全部开源
a-m-team 又发新论文了。 这个团队上周刚刚在 Hugging Face 低调开源了32B稠密模型,但在多项关键推理评测中击败了 DeepSeek-R1,并与超大规模的 MoE 模型Qwen3-235B-A22B、Seed1.5-Thinking 不相上下,因此赢得了海内外的不少关注。 今天,a-m-team 发布了一篇名为“Not All Correct Answers Are Equal: Why Your Distillation Source Matters”的论文,介绍了 R1 之后下一代推理模型的小进展。
Mistral 发布编程专用开源 AI 模型 Devstral:240 亿参数、单张 RTX 4090 显卡可运行
这款模型由 Mistral AI 与 All Hands AI 合作开发,参数规模为 240 亿,目前处于“研究预览”阶段,并以 Apache 2.0 开源许可发布,允许开发者及企业无限制地用于商业用途。
Video Ocean发布2K/4K HDR视频生成工具,性价比引爆全网
5月21日,潞晨科技旗下Video Ocean重磅推出全新AI视频生成工具,支持5-10秒内生成2K/4K HDR高质量大片,迅速登顶Product Hunt热门榜单,引发广泛关注。 Video Ocean提供海量模板,内置Laugh、Cakeify、Crush等炫酷特效,用户一键套用即可轻松创作电影级视频,即使新手也能快速上手,秒变“导演”。 该工具支持文生视频、图生视频及角色生视频功能,满足多样化创作需求,从3D写实到赛博朋克风格均可实现。
百度飞桨PaddleOCR 3.0开源发布 OCR精度跃升13%
2025年5月20日,百度飞桨团队正式发布了PaddleOCR3.0版本,并对外开源。 这一新版本在文字识别精度、多语种支持、手写体识别以及高精度文档解析等方面取得了显著进展,进一步提升了PaddleOCR在OCR领域的技术实力和应用价值。 PaddleOCR自发布以来,凭借其学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目。
谷歌Sparkify实验产品上线,输入问题秒变动画短片,复杂知识秒懂
谷歌推出全新实验性AI产品Sparkify,通过Gemini与Veo模型,用户只需输入一个问题或复杂概念,即可在2分钟内生成直观的动画短视频,深入浅出地讲解知识点。 从“珍珠奶茶的起源”到“8小时工作制的演变”,Sparkify以其创新的教育应用场景和高效的知识传播方式引发热议。 AIbase综合最新社交媒体动态,深入解析Sparkify的技术亮点及其对教育与内容创作领域的深远影响。
谷歌Veo 3强势发布:视频生成迈入音画同步新时代
谷歌最近推出了其最新的视频生成模型 Veo3,标志着 AI 视频技术的一次重大飞跃。 这款新模型实现了音画同步生成功能,能够根据用户的提示词,自动生成包含对白、唇动对齐和环境音效的高质量视频。 这一突破使得 AI 视频制作跨越了多模态的边界,让视频不仅会动,还会说话。
法院驳回谷歌与 Character.AI 的撤诉请求,AI 引发自杀案诉讼继续进行
近日,佛罗里达州的一名法官驳回了谷歌及其子公司 Character.AI 提出的撤诉请求,此案涉及一名14岁用户因使用聊天机器人而导致自杀的指控。 此案被认为是一起具有开创性的诉讼,因其首次将 AI 技术的潜在危害推上法庭。 图源备注:图片由AI生成,图片授权服务商Midjourney诉讼于2023年10月提起,原告梅根・加西亚(Megan Garcia)指控 Character.AI 的聊天机器人在未经过充分测试和安全审查的情况下被发布,从而对其儿子斯图尔特・塞泽尔(Sewell Setzer III)造成了情感和心理上的伤害,最终导致他于2024年2月自杀。
谷歌CEO宣布:Gemini AI月活用户突破4亿,覆盖15亿全球用户
在最近的一次公开讲话中,谷歌的 CEO 桑达尔・皮查伊透露,公司的 Gemini AI 应用程序的月活跃用户数量已经超过4亿。 这一数据的公布无疑为 Gemini AI 的成功增添了光彩,并显示出消费者对这一人工智能技术的强烈兴趣。 Gemini AI 不仅在用户量上取得了显著的成绩,还在全球范围内实现了广泛的覆盖。
谷歌新 AI 模式引发媒体行业愤怒,称其为 “盗窃”
最近,谷歌在美国全面推出了其新 AI 模式,这一功能引发了新闻出版商的强烈反对。 美国一些最大的新闻出版商所支持的行业协会 —— 新闻 / 媒体联盟在声明中指出,这一新功能正在剥夺出版商的流量和收入。 谷歌在周二的 Google I/O 活动中宣布,该模式将为所有美国用户开放。
京医千询医疗大模型 2.0 升级,开启智能诊疗新时代
近日,京东健康宣布其自主研发的医疗大模型 “京医千询” 将迎来全新2.0版本的升级。 这一升级不仅是在技术上的创新,更是对医疗服务的深刻变革,旨在提升临床诊疗的效率和准确性。 京医千询的2.0版本通过融合多模态感知与深度检索技术,能够整合来自不同来源的临床信息。
Shopify 推出全新 AI 工具,让在线商店建设变得更简单
Shopify 在最近的一次发布会上宣布推出一项创新的生成式人工智能功能,名为 “AI 商店构建器”。 这一新工具旨在帮助商家通过输入描述性的关键词,快速搭建自己的在线商店,极大简化了电子商务的建设过程。 这一 AI 商店构建器的最大亮点是,它能够根据用户输入的关键词,自动生成三种不同的商店布局。
OpenAI 得州数据中心扩建计划获 116 亿美元投资
有媒体报道称,初创公司 Crusoe 为 OpenAI 在得克萨斯州建设的数据中心成功获得116亿美元的融资。 这一资金将用于将目前的两栋建筑扩展至八栋,以满足日益增长的计算需求。 图源备注:图片由AI生成,图片授权服务商Midjourney据悉,这座数据中心预计将成为 OpenAI 的最大算力基地,每栋建筑将配备多达五万块英伟达 Blackwell 芯片。
人工智能寒冬已至?明星初创公司 Builder.ai 破产敲响警钟
曾被誉为“像订披萨一样简单”开发应用程序的英国人工智能初创公司 Builder.ai 近日宣告破产,引发行业震动。 这家曾获得微软、软银等巨头超过4.5亿美元投资、估值一度超过10亿美元的明星企业,最终因资金链断裂而倒下,令人唏嘘。 据报道,一家投资公司从 Builder.ai 账户中扣押了3700万美元,导致其仅剩500万美元运营资金,触发优先贷款机构的违约决定。
Mistral 重返开源阵营:发布超高效代码 AI 模型 Devstral 笔记本电脑也能跑
法国人工智能模型制造商 Mistral 在因其最新闭源模型 Medium3受到部分开源社区批评后,迅速回归开源路线。 该公司近日与开源初创公司 All Hands AI(OpenDevin 的创建者)合作,推出了全新的开源语言模型 Devstral。 这款拥有2400万参数的轻量级模型,专为代理 AI 软件开发而设计,其性能甚至在特定基准测试中超越了许多参数高达数十亿的竞争对手,包括一些闭源模型。
微软 Win11 五月更新惊人增大,AI 文件占据大部分空间
近日,微软于5月13日发布了针对 Windows1124H2和 Windows Server2025(24H2)的累积安全更新 KB5058411。 令人惊讶的是,此次更新包的体积高达4368.9MB,远远超过了上个月的更新包 KB5059087的800MB。 根据科技媒体 borncity 的报道,有用户使用7-zip 工具解压了该更新包,结果显示其中常规安全更新的文件仅占约850MB,而其余约3GB 的文件则与微软的人工智能(AI)应用相关。
OpenAI以65亿美元收购Jony Ive创立的初创公司io,迈向AI硬件新纪元
近日,彭博社报道,OpenAI 宣布以接近65亿美元的全股票交易收购了由前苹果首席设计师 Jony Ive 联合创立的 AI 设备初创公司 io。 这项交易不仅是 OpenAI 历史上最大的一笔收购,也标志着其在 AI 硬件领域的一次重大布局。 io 公司是 Jony Ive 与几位苹果老同事共同创立的,旨在推动创新的消费电子产品。
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
5月22日,昆仑万维集团面向全球市场正式发布了天工超级智能体(Skywork Super Agents)。 这款产品采用AI agent架构和deep research技术,能够一站式生成文档、PPT、表格、网页、播客和音视频等多种内容,标志着“AI版Office”时代的到来。 天工超级智能体的发布,代表了中国在AI技术领域的重大突破。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉