模型
豆包团队开源SuperGPQA:挑战285学科AI推理极限
近日,字节跳动豆包大模型团队联合M-A-P开源社区发布SuperGPQA,一个覆盖285个研究生级学科、包含26,529道专业问题的知识推理基准测试。 该数据集不仅涵盖数学、物理等主流学科,还首次将轻工业、农业、服务科学等长尾学科纳入评估体系,填补了现有基准测试在长尾知识领域的空白。 SuperGPQA已被用于揭示开源与闭源模型的性能差距,成为AI发展的重要工具。
3/4/2025 2:03:00 PM
AI在线
智谱发布首个能生成汉字的开源文生图模型CogView4
2025年3月4日,北京智谱华章科技有限公司宣布推出首个支持生成汉字的开源文生图模型——CogView4。 该模型在DPG-Bench基准测试中综合评分排名第一,成为开源文生图模型中的SOTA(State of the Art),并遵循Apache2.0协议,是首个支持该协议的图像生成模型。 CogView4具备强大的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入,并能生成任意分辨率的图像。
3/4/2025 1:39:00 PM
AI在线
超强视频生成模型 Wan2.1 GP:低配GPU也能搞定大片!
近日,DeepBeepMeep 团队在 GitHub 上发布了 Wan2.1GP,一个针对低端 GPU 用户优化的视频生成模型。 该模型基于阿里巴巴的 Wan2.1,旨在为缺乏高性能 GPU 资源的用户提供强大的视频生成能力。 Wan2.1GP 的推出标志着视频生成技术的一个重要进步,尤其是在开放源代码领域。
3/4/2025 11:50:00 AM
AI在线
亚马逊的 AGI 负责人表示,AI 已深入每个业务角落
在巴塞罗那举行的移动世界大会上,亚马逊人工智能通用技术副总裁维沙尔・沙尔玛(Vishal Sharma)表示,人工智能(AI)已经深入亚马逊的各个业务领域,几乎没有任何部分能够逃脱其影响。 他表示,亚马逊正在通过自己的基础模型在云计算服务 AWS、仓库的机器人以及消费者产品 Alexa 等多个应用中部署 AI 技术。 图源备注:图片由AI生成,图片授权服务商Midjourney沙尔玛提到,亚马逊目前拥有大约75万台机器人,这些机器人在仓库中从事拣货等多项任务。
3/4/2025 11:22:00 AM
AI在线
播客平台 Podcastle 推出AI文本转语音模型:提供 450 种语音
在快速发展的播客领域,Podcastle 平台近日宣布推出其全新的 AI 文本转语音模型 Asyncflow v1.0。 这个新模型不仅为用户提供了超过450种不同的 AI 语音,还向开发者开放了 API 接口,以便于他们将这一文本转语音功能直接集成到自己的应用程序中。 Podcastle 的创始人 Arto Yeritsyan 表示,公司一直希望能开发一个文本转语音模型,但由于过去高昂的训练成本和数据需求,这一愿望一直未能实现。
3/4/2025 11:19:00 AM
AI在线
REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈
iDreamer 致力于打造一个激发科研热情的全球中心。 我们帮助教授将愿景变为现实,为学生照亮塑造未来的道路。 在这里,没有资源的壁垒,没有思想的界限,只有团结一心追求卓越。
3/4/2025 11:00:00 AM
新闻助手
从编码到创意写作 xAI Grok-3 击败 GPT4.5全能登顶大模型竞技场
xAI 最近发布了一则激动人心的消息,其最新 AI 模型 Grok-3在 Chatbot Arena 排行榜上表现突出。 这款模型被命名为“grok-3preview-02-24”,在多个关键领域展现了卓越性能。 xAI 的 Grok-3-Preview-02-24就以1分的微弱优势超越 GPT4.5-Preview。
3/4/2025 9:48:00 AM
AI在线
谷歌发布 SpeciesNet AI 模型 助力野生动物识别
近日,谷歌宣布开源一款名为 SpeciesNet 的人工智能模型,该模型旨在通过分析相机捕捉到的照片来识别动物种类。 随着科研工作者在全球范围内使用相机陷阱(连接红外传感器的数字相机)进行野生动物研究,这些设备虽然提供了宝贵的数据,但同时也会产生大量数据,处理这些数据往往需要耗费数天到数周的时间。 为了解决这一问题,谷歌在六年前启动了 “野生动物洞察” 项目,属于其谷歌地球外展慈善计划的一部分。
3/4/2025 9:29:00 AM
AI在线
性能无损,模型隐私保护效果提升50%!蚂蚁数科创新跨域微调框架| AAAI 2025 Oral
大模型的快速及持续发展,离不开对模型所有权及数据隐私的保护。 AAAI 2025期间,蚂蚁数科、浙江大学、利物浦大学和华东师范大学联合团队提出了一种创新的跨域微调框架ScaleOT,可以实现在模型性能无损的前提下,将模型隐私保护效果提升50%。 相比于知识蒸馏技术,还降低了90%的算力消耗,为百亿级参数模型的跨域微调提供了一种高效和轻量化的解决方案。
3/4/2025 9:20:00 AM
量子位
阿里PC-Agent重构人机交互,精准拆解跨应用指令,自动化办公更进一步
面向复杂PC任务的多模态智能体框架PC-Agent,来自阿里通义实验室。 从Office到浏览器,跨APP工作流都可以交给AI来完成了。 指令1(翻译):在记事本应用程序中,打开“文档”中的“备忘录”文件,查看上午的第二项活动。
3/4/2025 9:10:00 AM
量子位
标点符号成大模型训练神器!KV缓存狂减一半,可处理400万Tokens长序列,来自华为港大等 | 开源
文字中貌似不起眼的标点符号,竟然可以显著加速大模型的训练和推理过程? 来自华为、港大、KAUST和马普所的研究者,就提出了一种新的自然语言建模视角——SepLLM。 起因是团队发现某些看似无意义的分隔符,在注意力得分中占据了不成比例的重要地位。
3/4/2025 9:00:00 AM
量子位
Hinton怒斥马斯克「电锯」屠遍美国科学界!3410位大佬联名将其从英国皇家学会除名
AI教父Hinton和马斯克吵起来了! 今天,Hinton公开叫板,「马斯克应该被英国皇家学会除名,最关键原因是他正在对美国科学机构造成巨大损害」。 这番言论如同一枚重磅炸弹,瞬间点燃了舆论战场。
3/4/2025 8:30:00 AM
新智元
GCD-DDPM:用扩散模型重塑变化检测,精准捕捉细粒度变化
一眼概览GCD-DDPM 提出了一种 基于差分特征引导的去噪扩散概率模型(DDPM) 进行 变化检测(CD) 的方法,采用 生成式方式 直接生成变化检测(CD)图,而非传统的判别式分类方式。 在四个高分辨率遥感数据集上,该方法展现了优越的检测性能。 核心问题目前主流变化检测(CD)方法大多依赖 CNN 或 Transformer 进行判别式特征学习,但它们在 同时捕获局部细节信息和长距离依赖关系 方面存在局限,导致 变化检测精度不足,尤其是对于 复杂场景的细粒度变化 无法精准捕捉。
3/4/2025 4:00:00 AM
萍哥学AI
告别传统 SSE!fetch-event-source 让 AI 流式处理更高效
在 AI 大模型飞速发展的时代,前端开发者面临着如何高效处理实时数据流的挑战。 服务器发送事件(SSE)作为一种单向通信协议,能够让服务器主动向客户端推送实时更新,广泛应用于实时聊天、新闻推送等场景。 然而,标准的 EventSource API 存在诸多限制,例如只能使用 GET 请求、无法传递请求体等。
3/4/2025 3:00:00 AM
PIG AI
Flora推出AI驱动的“无限画布”工具,专为创意专业人士打造
在当今的创意行业中,人工智能(AI)正逐渐成为重要的工具。 许多人只需输入几句话,就能利用 AI 模型生成故事、图像或短片。 然而,Flora 的创始人兼首席执行官韦伯・王(Weber Wong)指出,现有的 AI 工具大多是 “由非创意人士为其他非创意人士所设计”,并不能真正满足专业创意人员的需求。
3/3/2025 1:53:00 PM
AI在线
Sesame 发布 CSM 语音模型:跨越“恐怖谷”,逼真程度惊艳全球
Sesame 公司最新推出的语音合成模型“Conversational Speech Model”(简称 CSM)近日在 X 平台上引发热议,被誉为“像真人说话一样的语音模型”。 这款模型以其惊艳的自然度和情感表达能力,不仅让用户“已经无法分辨”其与人类的区别,还宣称成功跨越了语音领域的“恐怖谷效应”。 随着演示视频和用户反馈的传播,CSM 正迅速成为 AI 语音技术的新标杆。
3/3/2025 11:37:00 AM
AI在线
AI学术算命?Gemini 2.0预测谷歌AI大佬职业生涯,准到离谱!
如果让人工智能来点评博士论文,还顺手预测一下作者将来的职业发展。 会是什么样子? 最近,谷歌首席科学家、Gemini负责人Jeff Dean就玩了这么一出,他把自己的博士论文交给了最新的Gemini 2.0。
3/3/2025 11:21:40 AM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉