资讯列表
「全球首个自回归视频生成大模型」,刚刚,Swin Transformer作者创业团队重磅开源!
视频生成领域,又出现一位重量级开源选手。 今天,马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1。 这是一个通过自回归预测视频块序列来生成视频的世界模型,生成效果自然流畅,还有多个版本可以下载。
142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究
你是否曾想过DeepSeek-R1为什么能「思考」? 距离DeepSeek-R1这只「巨鲸」引发的全球AI海啸似乎刚刚平静下来,但推理模型已经成为了AI宠儿。 不论是Gemini 2.5Pro,还是o3,o4-mini,以及所有人都在期待的DeepSeek-R2,都是推理模型。
清华特奖得主团队视频生成AI一夜刷屏!100%开源+61页技术报告,还能无限扩展生成,网友:游戏规则改变者
整整61页的技术报告中还详细介绍了创新的注意力改进和推理基础设施设计,给人一种视频版DeepSeek的感觉。 图片Magi-1将视频生成卷到了新高度,大片级品质直接锁住大家的眼球,请看VCR:其主打能力,一是无限长度扩展,实现跨时间的无缝连贯叙事:图片二是能将生成时长控制精确到每一“秒”:图片另外,Magi-1对物理规律也有更深度的理解,Physics-IQ基准测试56.02%,大幅领先一众顶流。 现在看这张图,Sora的时代是真的过去了。
AI治理能力提升!抖音一季度封禁黑产账号260万个
抖音发布《2025第一季度黑产治理数据报告》,显示其在打击黑色产业链方面取得显著成效。 报告显示,抖音在第一季度封禁了260万个涉及水军、欺诈和违规导流的黑产账号,并将涉嫌违法犯罪的线索上报给有关部门。 抖音通过构建以 AI 为核心的治理体系,显著提升了在黑产违规场景的巡检、预警、研判等环节的效率。
全球首款!Ainos AI 鼻成功植入ugo人形机器人,机器拥有“嗅觉”
人工智能气味数字化领导者 Ainos.宣布,其专有的 AI Nose 嗅觉模块已成功安装到日本顶级服务机器人公司 ugo, Inc. 开发的人形机器人上。 此次于2025年4月9日完成的安装,标志着全球首个具备功能性嗅觉的机器人诞生,为机器人技术、人工智能和人机交互开创了全新纪元。
日本公司为人形机器人装上“AI 鼻子”,赋予其嗅觉能力
日本Ainos与ugo合作,首次将AI鼻子系统集成到商业人形机器人中,让机器人具备嗅觉感知能力。这一技术突破将在工业、医疗和日常生活等领域带来革命性变化。#AI鼻子技术# #机器人嗅觉#
真我推出首款 AI 翻译耳机 Bud Air7 Pro,支持 32 种语言翻译!
真我手机官方微博宣布,其首款 AI 翻译耳机 Bud Air7Pro 即将于4月23日下午16时正式上市。 这款耳机将搭载讯飞的星火认知大模型4.0Ultra,具备强大的翻译能力,不仅能够支持中文与32种语言的面对面翻译,还具备同声传译功能,为用户的跨语言交流提供了极大的便利。 这款耳机的发布将与真我 GT7手机的新品发布会一起进行,届时将展示更多创新技术。
RAG增强系统Node:AI检索革命,效率飙升30%!
随着生成式人工智能技术的飞速发展,检索增强生成(Retrieval-Augmented Generation, RAG)系统正成为提升大语言模型(LLM)准确性和上下文相关性的关键技术。 近日,一款名为NodeRAG的创新RAG增强系统引起了业界广泛关注,其独特的异构图结构为RAG工作流带来了革命性突破。 NodeRAG:异构图驱动的RAG新范式NodeRAG是一个以图结构为核心的RAG框架,通过引入异构图(Heterogeneous Graph)技术,将文档分解信息与大语言模型提取的洞察力统一为图中的节点。
OpenAI o3 / o4-mini 模型 AI 生成文本含特殊符号,推测为隐形水印
AI 初创公司 Rumi 发现 OpenAI 公司在 o3 和 o4-mini 模型中,嵌入了窄不换行空格(Narrow No-Break Space, NNBSP, U+202F)等特殊 Unicode 字符。
Claude-3 IQ首超人类平均水平,Anthropic引领AI智能新纪元
Anthropic的Claude-3模型在IQ测试中取得突破性进展,平均得分首次超过人类标准值100,成为AI发展史上的里程碑。 据AIbase了解,Claude-3在挪威Mensa IQ测试中的表现优于其前代模型,标志着AI在认知能力上的显著飞跃。 社区分析指出,这一成就不仅反映了Anthropic的技术实力,还引发了对AI未来发展的广泛讨论。
Leidos投资 1000 万美元推进 AI 辅助疾病检测工具开发
Leidos近日宣布,将在未来五年内投资1000万美元,与匹兹堡大学计算病理学与人工智能卓越中心(CPACE)合作,致力于开发基于人工智能的疾病检测和管理工具。 此次合作的首要任务是利用 AI 技术加速心脏病和癌症的检测,提高诊断的周转时间,进而促进更有效的医疗管理。 图源备注:图片由AI生成,图片授权服务商MidjourneyLeidos首席执行官汤姆・贝尔表示,这项投资的目标是加速对每年影响数百万人的各种疾病的治疗。
初创公司 Brellium 获 1670 万美元融资,助力医疗记录审核的智能化升级
初创公司 Brellium 近日宣布获得1670万美元的 A 轮融资,资金将用于扩大其基于人工智能的医疗记录审核解决方案。 这一技术旨在帮助医疗机构自动化临床质量管理和保险合规,从而提升医疗服务的效率与准确性。 Brellium 的联合创始人扎克・罗森(Zach Rosen)在一次个人经历中深刻感受到医疗文档的疏漏可能对患者造成的严重影响。
OpenAI 推出 macOS ChatGPT 新功能,助力编程与搜索更高效
近日,OpenAI 为 macOS 版 ChatGPT 推出了一项强大的集成功能,使用户在进行搜索、写作和编程等任务时更加便捷。 此项更新在 AppleInsider 等外媒的关注下正式发布,标志着 ChatGPT 与 macOS 应用的互动进入新阶段。 早在今年3月,OpenAI 就推出了名为 “Work with Apps on macOS” 的功能,旨在提升 ChatGPT 与 macOS 应用程序之间的互动体验,所有用户,无论是付费还是免费,都能畅享这一新功能。
超强AI电商购物助手!Add To Cart AI:可理解文本、语音、图像,帮用户找到产品
在当今快速发展的电商行业中,AI电商购物助手发展也备受关注。 Add To Cart AI 是一款专为电商平台设计的 AI 驱动购物助手,旨在帮助消费者更快找到心仪产品,同时提升商家的转化率和销售额。 它可以理解文本、语音、图像甚至实时视频的代理。
AI 助手 Claude 的“内心世界”:Anthropic 新研究解密其价值观
Anthropic 公司于周一发布了一项名为“Values in the Wild”的研究,深入剖析了 AI 助手 Claude 在实际用户交互中的价值观表达。
韩国内阁通过 1.8 万亿韩元 AI 投资补充预算:一年内要买 10000 块 GPU
该预算的 80% 以上用于 GPU 购买,其它投资项目包括选拔先进 LLM 开发团队、扩大公私合作 AI 创新基金规模、支持韩国企业 NPU 商业化、招募和培养 AI 人才。
OpenAI 为 macOS 版 ChatGPT App 带来更强大集成功能:能直接搜索、编程
今年3月,OpenAI 就发布了一项名为“Work with Apps on macOS(在macOS上与App协作)”的功能,提供了 ChatGPT 与 macOS 应用程序更便捷的集成体验,付费和免费用户都可使用。
力压群雄:谷歌 Gemini 2.5 Pro 成首款完全理解 PDF 布局的 AI 模型,可精确引用
最新报告指出,谷歌旗下的 Gemini 2.5 Pro 模型能准确解析 PDF 文档的视觉结构,实现精准的视觉引用功能,成为首款能完全理解 PDF 布局的 AI 模型。