AI在线 AI在线

资讯列表

阿里通义实验室LHM技术实现从单图像的快速3D 人体重建与动画生成

近日,阿里通义实验室一项名为 LHM(大型可动画人体重建模型)的创新技术在3D 人体重建领域取得了重大突破,为该领域带来了全新的发展方向和应用前景。 从单个图像进行可动画的3D 人体重建一直是一个极具挑战性的任务,存在着几何、外观和变形分离的模糊性等问题。 当前的最新研究进展大多集中在静态人体建模方面,并且这些方法往往依赖于合成的3D 扫描进行训练,这在很大程度上限制了它们在实际场景中的泛化能力。
3/24/2025 9:54:00 AM
AI在线

AMD发布GAIA开源项目 助力本地大语言模型高效运行

近日,AMD 宣布推出一款名为 GAIA 的开源应用,旨在为用户提供一种高效、本地化的方式来运行大语言模型(LLM)。 目前,该应用已支持 Windows 平台,特别为锐龙 AI300系列处理器进行了优化,充分发挥了这些处理器在 AI 任务中的优势。 GAIA 是一个生成式 AI 应用,用户可以在个人电脑上私密地运行 LLM,确保数据隐私。
3/24/2025 9:40:00 AM
AI在线

Cloudflare 推出 “AI 迷宫”,引导恶意爬虫走入虚假数据陷阱

全球知名的网络基础设施公司 Cloudflare 近日宣布推出一项名为 “AI Labyrinth”(AI 迷宫)的新工具,旨在打击未经授权抓取网站数据的网络爬虫。 这一举措的核心在于,当 Cloudflare 监测到不当的爬虫行为时,该工具会将这些爬虫引导到一系列 AI 生成的虚假页面,目的在于 “拖延、迷惑并浪费” 恶意爬虫的资源。 长期以来,网站管理员依赖 “robots.txt” 文件来管理爬虫的访问权限,但很多 AI 公司,包括一些知名企业,如 Anthropic 和 Perplexity AI,常常忽视这一规则。
3/24/2025 9:40:00 AM
AI在线

Meta 测试 AI 生成 Instagram 评论功能,用户反应存疑

Meta 正在测试一项新功能,允许用户利用人工智能在 Instagram 上生成评论建议。 X 用户乔纳·曼扎诺(Jonah Manzano)发现并分享了这一测试功能,显示用户可以点击帖子下方的铅笔图标来访问 Meta AI,该 AI 会分析照片并提供三条可能的评论。 如果用户不满意,还可以刷新获取更多建议。
3/24/2025 9:38:00 AM
AI在线

AI自我纠错,Diffusion超越自回归!质量提升55%,已达理论证据下界

如果大语言模型(LLMs)能够发现并纠正自己的错误,那岂不是很好? 而且,如果能够直接从预训练中实现这一点,而无需任何监督微调(SFT)或强化学习(RL),那会怎样呢? 最新提出的离散扩散模型,称为GIDD,它能够做到这一点。
3/24/2025 9:35:00 AM
新智元

全球首个智能体重管理助手「减单」问世,助力健康新篇章

近日,安徽医科大学联合多个相关机构正式发布了全球首个体重管理大模型图源备注:图片由AI生成,图片授权服务商Midjourney智能助手「减单」。 该模型的推出旨在应对我国日益严重的超重与肥胖问题,标志着体重管理领域的又一次重大创新。 「减单」是基于多种人工智能模型进行训练而成,结合了超过40万名患者的数据,致力于为用户提供个性化的体重管理方案。
3/24/2025 9:34:00 AM
AI在线

研究显示,AI 用户可与双人团队媲美,提升工作效率

最近的一项研究显示,使用人工智能(AI)的个人在工作表现上可与传统的双人团队相媲美。 此次研究由776名洁(Procter & Gamble)专家参与,他们在一天的工作坊中为多个业务单位开发产品创意。 研究将参与者分成两组,分别是由一名商业专家和一名技术专家组成的团队,和单独的个人,其中一半的团队和个人都获得了 GPT-4和 GPT-4o 的访问权限。
3/24/2025 9:33:00 AM
AI在线

2030年,AGI概率至少10%!AI范式转变快,谁能预测GenAI下一代?

AGI已经来了? 还是快来了? 还是说AGI也是一种「技术乌托邦」?
3/24/2025 9:30:00 AM
新智元

​谷歌推Gemini实时AI视频功能,手机摄像头实时解读画面内容

谷歌最近宣布其 Gemini Live 已开始推出新功能,这些功能使其能够通过智能手机摄像头实时回答用户的问题,并 “看到” 用户的屏幕。 这些新功能是在谷歌的 “Project Astra” 项目支持下,经过近一年的研发后首次面世。 根据谷歌发言人 Alex Joseph 的介绍,Gemini Live 的更新意味着用户在使用手机时可以通过该助手获得更加智能和直观的支持。
3/24/2025 9:25:00 AM
AI在线

奥特曼豪言:OpenAI第一个发布AGI!下一代人不可能比AI聪明,却没人在意

奥特曼再谈AGI信念! 最近,奥特曼在一期采访中坚定地表示,「OpenAI将第一个发布AGI,并没有人多少人在意」。 他承认,当AI变得更加自主,能够完成通常需要整个组织,才能实现的任务时,自己并不知道那一刻会发生什么。
3/24/2025 9:22:00 AM
新智元

​全球首个体重管理AI大模型 “减单” 在合肥发布 基于DeepSeek等模型

全球首个体重管理 AI 大模型 “减单” 在合肥隆重发布。 该项目是由安徽医科大学校长翁建平教授团队、中国科学技术大学附属第一医院及浙江诺特健康科技股份有限公司共同研发的成果。 这一模型的推出,旨在帮助越来越多的超重和肥胖患者有效管理体重。
3/24/2025 9:15:00 AM
AI在线

每天2小时成绩逆袭全美前2%!AI助教让学生不再内卷

每天只用2小时就能搞定繁重的学习任务,剩下时间开发自己的兴趣项目,考试成绩还提高了。 这样的学校你愿意尝试吗? 据福克斯新闻报道,德克萨斯州一家名为Alpha School的私立学校在引入AI「助教」后,学生的考试成绩蹭蹭上涨,提高到了全美国的前2%。
3/24/2025 9:12:00 AM
新智元

​苹果重组AI高管团队,Siri升级推迟至2026年

近日,苹果公司对其高管团队进行了重大调整,旨在振兴其人工智能战略。 这一举措是在经历了几个月的技术研发滞后之后做出的,显示出苹果对当前进展的失望与对未来发展的迫切期望。 重组的重点主要集中在苹果的语音助手 Siri 项目上。
3/24/2025 9:10:00 AM
AI在线

Idea撞车何恺明「分形生成模型」!速度领先10倍,性能更强

前不久,大神何恺明刚刚放出新作「分形生成模型」,递归调用原子生成模块,构建了新型的生成模型,形成了自相似的分形架构,将GenAI模型的模块化层次提升到全新的高度。 论文地址: 地址:,澳大利亚国立大学的研究人员提出了一个全新的图像生成模型ARINAR,在思想上与分形生成模型不谋而合,但是在性能和速度上都显著提升,base模型的FID从11.8提升到2.75,生成时间从2分钟降低到12秒! ARINAR不仅超越了之前的扩散模型,与目前表现最好的自回归模型MAR相比,ARINAR生成质量相当,速度是MAR的5倍。
3/24/2025 9:08:00 AM
新智元

硅谷投资人爆料:AI爆炸率先发生在中国!芯片扩大1万倍,AI逼近物理极限

如果AI系统能自己设计出更强大的AI,智能爆炸可能很快就要到来了! 而人类,会被AI迅速甩在后面。 最近,硅谷投资人、EverFi CEO兼创始人Tom Davidson等人发表了一篇长文硬核博客,详细讨论了智能爆炸(Intelligence explosion, IE)的类型以及对应的发生概率。
3/24/2025 8:55:00 AM
新智元

AI PS卷起来了!谷歌Gemini动嘴P图火出圈,马斯克Grok连夜上线图像编辑

Grok连夜上线图片编辑功能。 昨晚,Grok上线图片编辑功能,可以通过文字描述直接修改图片。 比如你可以上传一张个人证件照,「动动嘴」让Grok给你PS一套全新的西服。
3/24/2025 8:43:00 AM
新智元

基于代理知识蒸馏技术克服文档提取和RAG策略失败问题

译者 | 朱先忠审校 | 重楼简介当下,许多生成式AI应用场景仍然围绕检索增强生成(RAG)展开,但始终未能满足用户的期望。 尽管对RAG改进的研究越来越多,甚至在流程中添加了代理技术,但许多解决方案仍然无法返回详尽的结果,遗漏了文档中很少提及的关键信息,需要多次搜索迭代,并且通常难以协调多个文档中的关键主题。 最糟糕的是,许多实现方案仍然依赖于将尽可能多的“相关”信息与详细的系统和用户提示一起塞入模型的上下文窗口。
3/24/2025 8:20:39 AM
朱先忠

谷歌正在推出 Gemini 实时人工智能视频功能

谷歌发言人亚历克斯・约瑟夫在给 The Verge 的一封电子邮件中证实,谷歌已开始向 Gemini Live 推出新的人工智能功能,这些功能使其能够“看到”你的屏幕内容,或者通过你的智能手机摄像头获取画面,并实时回答与之相关的问题。
3/24/2025 8:08:39 AM
浩渺