模型
耶鲁大学联合Adobe提出SynthLight:智能重塑人像照明,打造完美光影!
耶鲁大学和Adobe提出一种用于人像重新照明的扩散模型SynthLight,该方法将图像重新照明视为重新渲染问题,其中像素会根据环境照明条件的变化而变化。 在真实肖像照片上可以产生逼真的照明效果,包括颈部的明显投射阴影和皮肤上的自然镜面高光。 相关链接论文:: 是一种用于人像重新照明的扩散模型。
5/23/2025 11:07:54 AM
字节跳动与清华大学合作推出时序多模态大模型ChatTS
在多模态大语言模型(MLLM)迅速发展的浪潮中,字节跳动与清华大学近日联合发布了名为 ChatTS 的新型时序多模态大模型。 ChatTS 的推出不仅为时序数据的处理与推理注入了新活力,也填补了当前市场在这一领域的空白。 该模型的开发旨在提升 AI 在时序数据问答与推理中的应用能力,尤其在 AIOps 与金融等需要处理复杂时序数据的场景中显得尤为重要。
5/23/2025 11:00:55 AM
AI在线
DMind引领Web3AI革命:推出首批专业区块链大语言模型DMind-1系列
在人工智能与区块链技术加速融合的关键时刻,开源AGI研究机构DMind正以其创新性的Web3专用语言模型引领行业变革。 该机构近日发布了DMind-1和DMind-1-mini两款领域专用大型语言模型,专门针对区块链、去中心化金融和智能合约等Web3应用场景进行深度优化。 专业化AI模型的技术突破DMind-1系列模型代表了AI技术在垂直领域应用的重要进展。
5/23/2025 11:00:55 AM
AI在线
新基准评估语言模型的 “谄媚” 行为,GPT-4o 表现最为明显
最近,随着 OpenAI 对 GPT-4o 的一些更新进行回撤,关于该模型 “谄媚” 用户的讨论引发了广泛关注。 前 OpenAI 首席执行官埃梅特・希尔(Emmet Shear)和 Hugging Face 首席执行官克莱门特・德朗格(Clement Delangue)均表示,GPT-4o 对用户的过度赞美令人感到困扰,这种行为不仅可能导致模型传播错误信息,还可能强化有害行为。 为了应对这一问题,斯坦福大学、卡内基梅隆大学和牛津大学的研究人员提出了一项新基准,旨在测量大型语言模型(LLM)的谄媚程度。
5/23/2025 11:00:55 AM
AI在线
Anthropic CEO:AI 模型的 “幻觉” 率低于人类
在最近于旧金山举行的 “与克劳德一起编程” 开发者活动中,Anthropic CEO 达里奥・阿莫迪(Dario Amodei)表示,当前的 AI 模型在 “幻觉” 或制造虚假信息方面,其发生频率低于人类。 他的这一观点引起了广泛关注,并且是在他讨论 AI 朝着人类水平智能(AGI)发展的过程中提出的。 阿莫迪表示,“这实际上取决于我们如何衡量。
5/23/2025 10:01:00 AM
AI在线
Mistral 推出新开源模型 Devstral:在笔记本上也能挑战 GPT-4.1-mini
法国初创公司 Mistral 再次引发关注,他们与开源团队 All Hands AI 合作推出了全新语言模型 Devstral。 这一模型不仅拥有240亿个参数,而且所需的计算资源显著低于许多同类产品,使其成为本地部署及设备端使用的理想选择。 对于那些拥有 RTX4090显卡或32GB 内存的用户而言,Devstral 可以轻松运行,带来了更加灵活的使用体验。
5/23/2025 10:00:56 AM
AI在线
谷歌黑科技炸场!LightLab:只需一张图+AI,光影编辑像呼吸一样简单,废片秒变电影级大片!
在之前的文章中以及和大家介绍过需要关于图像&视频重打光的方法,在今天的推送文章中,已经帮大家重新整理好了,欢迎大家点击阅读~今天给大家介绍谷歌提出的一种基于扩散模型的方法LightLab,可以实现对单张图像中光源的细粒度、参数化控制。 该方法能够调整可见光源的强度和颜色、环境光照的强度,并可在场景中插入虚拟光源。 LightLab方法能够对图像中的光源进行显式的参数化控制,同时生成物理上合理的阴影和环境光效应。
5/23/2025 9:36:53 AM
字节开源高精度文档解析大模型Dolphin:轻量高效,性能超GPT4.1、Mistral-OCR!
字节跳动刚刚开源一款全新文档解析模型——Dolphin。 与目前市面上各类大模型相比,这款轻量级模型不仅体积小、速度快,并且取得了令人惊艳的性能突破,解析效率提升近2倍。 测试结果显示,Dolphin在文档解析任务上解析准确率超越了GPT-4.1、Claude3.5-Sonnet、Gemini2.5-pro、Qwen2.5-VL等通用多模态大模型,以及最近推出的号称最强OCR大模型的Mistral-OCR等垂类大模型。
5/23/2025 9:03:00 AM
Claude4来袭!Anthropic推出"业界最强"AI模型,编程能力全面超越竞争对手
在首届开发者大会上,Anthropic推出了两款声称"业界最强"的AI模型,加剧了与OpenAI和谷歌的竞争Anthropic在周四举行的首届开发者大会上正式发布Claude4模型系列,包括Claude Opus4和Claude Sonnet4两款新模型。 该公司声称这些模型在多项流行基准测试中达到业界领先水平,专门针对编程任务进行了优化。 产品特性与定价策略新发布的Claude4系列具备分析大型数据集、执行长期任务和处理复杂操作的能力。
5/23/2025 9:00:55 AM
AI在线
太卷了!Anthropic发布Claude 4 编程和推理能力秒杀Gemini2.5pro
最近,人工智能界传来重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。 这次发布并没有华丽的口号或冗长的论文,关键词只有一个 ——“干活”。 根据 Anthropic 的说法,Claude Opus4被誉为全球最强的编程模型,能够稳定处理复杂且长期的任务,表现出色。
5/23/2025 9:00:55 AM
AI在线
小学数学题,大模型集体不及格!达摩院推出新基准VCBench
大模型做数学题的能力很强,可是它们真的能够理解基本的数学原理吗? 拿小学生的数学题进行测试,人类平均得分为93.30%,而大模型的表现让人意外:闭源模型中Gemini2.0-Flash(49.77%)、Qwen-VL-Max(47.03%)、Claude-3.7-Sonnet(46.63%)的综合表现最佳,但仍未突破50%准确率。 因为大模型可能并不能真正理解基本数学元素和视觉概念。
5/23/2025 8:47:00 AM
最强编码模型Claude 4!7小时不间断写代码,连玩24小时宝可梦,GitHub已选为Copilot底层模型
AI圈子好热闹。 今天凌晨,Claude终于迎来了它的重大版本升级——Claude 4来了! 此次主要发布的有两个模型:Claude Opus 4和Claude Sonnet 4。
5/23/2025 8:34:30 AM
量子位
腾讯混元 TurboS 技术报告全面揭秘,560B参数混合Mamba架构
腾讯发布了混元 TurboS 技术报告,揭示了其旗舰大语言模型 TurboS 的核心创新与强大能力。 根据全球权威大模型评测平台 Chatbot Arena 的最新排名,混元 TurboS 在239个参赛模型中位列第七,成为国内仅次于 Deepseek 的顶尖模型,并在国际上仅落后于谷歌、OpenAI 及 xAI 等几家机构。 混元 TurboS 模型的架构采用了创新的 Hybrid Transformer-Mamba 结构,这种新颖的设计结合了 Mamba 架构在处理长序列上的高效性与 Transformer 架构在上下文理解上的优势,从而实现了性能与效率的平衡。
5/22/2025 5:00:55 PM
AI在线
Mistral发布全新开源AI编程模型Devstral,轻松运行于单张显卡
近日,总部位于法国巴黎的 Mistral AI 公司联合 All Hands AI 推出了一款专为软件开发设计的开源 AI 模型 ——Devstral。 这款模型具有高达240亿的参数量,目前处于 “研究预览” 阶段,并以 Apache2.0开源许可发布,允许开发者和企业在商业用途上无所顾忌地使用。 Devstral 的发布标志着 AI 在编程领域中的一大步进,Mistral AI 在其官方博客中指出,该模型推动了 “agentic” 编码的发展。
5/22/2025 5:00:55 PM
AI在线
阿联酋推出阿拉伯语专用 AI 大模型,助力轻量化应用发展
在全球人工智能技术迅猛发展的背景下,阿布扎比技术创新研究院(TII)近日在 “阿联酋制造” 大会上,隆重发布了两款全新的人工智能大模型 ——Falcon Arabic 和 Falcon H1。 这两款模型分别针对阿拉伯语环境及低算力应用需求,旨在为当地市场提供更多定制化的 AI 解决方案。 Falcon 系列的命名灵感来自于 “猎鹰”,该系列模型最早于2023年发布,并迅速在开源社区引发关注。
5/22/2025 4:00:56 PM
AI在线
Meta推出J1系列模型,最强“AI法官”上线
近日,Meta 公司发布了其全新 J1系列模型,这是一项旨在提升 AI 判断能力的创新技术。 通过结合强化学习和合成数据的训练方法,J1模型不仅在判断的准确性上取得显著进步,还在公平性方面表现出色。 此次发布的消息由科技媒体 marktechpost 报道,令人瞩目。
5/22/2025 4:00:55 PM
AI在线
红帽发布全新 AI 推理服务器,推动混合云环境下智能化发展
红帽公司近期正式推出了红帽 AI 推理服务器(Red Hat AI Inference Server),这款服务器旨在为混合云环境提供更加高效和经济的 AI 推理服务。 通过采用先进的 vLLM 技术,并结合 Neural Magic 的创新能力,红帽希望为用户带来更快的响应速度和更优越的性能。 红帽 AI 推理服务器是一款专为高性能设计的开放推理解决方案,配备了一系列先进的模型压缩与优化工具。
5/22/2025 4:00:55 PM
AI在线
Meta 推出 “Llama 创业计划”,支持初创企业使用 AI 模型
Meta 公司近日宣布推出一项名为 “Llama 创业计划” 的新项目,旨在鼓励初创企业采用其 Llama AI 模型。 该计划为参与公司提供 “直接支持”,并在某些情况下提供资金支持。 任何在美国注册、融资少于1000万美元、拥有至少一名开发人员并正在开发生成式 AI 应用的公司,均可在5月30日前申请参与。
5/22/2025 4:00:55 PM
AI在线
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊