资讯列表
GPT-4.5 创造力比 GPT-4o 弱,浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准
Creation-MMBench 基准覆盖四大任务类别、51 项细粒度任务,用 765 个高难度测试案例,为 MLLMs 的“视觉创意智能”提供全方位体检。
4/4/2025 12:18:37 PM
汪淼
谷歌拉响通用人工智能警报,首次公开 AI 安全防御蓝图
DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。
4/4/2025 10:25:49 AM
故渊
皮尤公布美国 AI 威胁职业清单:收银员和记者风险较高,心理咨询师影响最小
皮尤研究中心最新调查显示,美国公众与AI专家对人工智能影响的预期存在显著差异:56%专家看好AI未来20年的积极影响,公众支持率仅17%。性别差异在专家群体中更突出,双方对就业影响判断也不同。#人工智能##AI影响#
4/4/2025 10:02:03 AM
故渊
Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子
AI智能体,能否复现顶会中重磅的AI研究? 今天,OpenAI团队发布了全新框架PaperBench,便可评估AI智能体复现顶尖研究的基础能力。 论文地址:,AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文,包括理解论文核心文献、开发可运行代码库,以及执行实验并验证结果。
4/4/2025 12:00:00 AM
新智元
联合国预计 2033 年 AI 市场规模将达到 4.8 万亿美元,比肩德国经济
人工智能成为数字化转型的重要力量,其收益仍然高度集中。当前,人工智能的基础设施和专业知识的获取仍然集中在少数几个经济体,仅100家公司(主要集中于中美两国)就占了全球企业研发支出的40%。
4/3/2025 9:20:12 PM
清源
实测完即梦3.0,我后悔大学选了设计专业……
编辑 | 杨文自从 GPT-4o 出了「吉卜力」滤镜后,社交媒体上简直是人均宫崎骏。 而这股「吉卜力热」也让 ChatGPT 圈了一大波粉,甚至一小时狂揽百万用户。 友商们也坐不住了。
4/3/2025 6:42:00 PM
AI好好用
天津中小学今年将新开《人工智能基础》地方课程,每周 1 课时
小学低年级段侧重感知和体验人工智能技术,小学高年级段和初中阶段侧重理解和应用人工智能技术,高中阶段侧重项目创作和前沿应用。
4/3/2025 5:32:51 PM
清源
速来!机器之心ICLR 2025新加坡现场人才晚宴开启报名
2025 年开年,以 DeepSeek R1 为代表的推理大模型开启炸场模式。 在短短数月内,DeepSeek 凭借其卓越的性能和广泛的适用性,迅速在人工智能领域掀起了一场技术革新的浪潮。 而后,国内外各大科技公司、科研机构迅速跟进,新研究、新应用不断涌现。
4/3/2025 5:21:00 PM
机器之心
DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型
上海交通大学与 SII 联合发布了 DeepResearcher,代码训练框架完全开源。 这是首个在真实网络环境中通过强化学习训练的 AI 研究模型。 随着大型语言模型(LLMs)推理能力的飞速发展,OpenAI、Google 和 XAI 等科技巨头纷纷推出了备受欢迎的 Deep Research 产品。
4/3/2025 5:18:00 PM
机器之心
RAG实战|向量数据库LanceDB指南
LanceDB介绍LanceDB是一个开源的用 Rust 实现的向量数据库(),它的主要特点是:提供单机服务,可以直接嵌入到应用程序中支持多种向量索引算法,包括Flat、HNSW、IVF等。 支持全文检索,包括BM25、TF-IDF等。 支持多种向量相似度算法,包括Cosine、L2等。
4/3/2025 4:02:14 PM
周末程序猿
仅需10万不到,DeepSeek R1 671B大模型本地部署实战指南
最近帮一个朋友部署本地的671b版本的deepseek r1,需求是要完全本地部署,但是又不想花太高的成本,没有并发要求,我一想,用ktransformers框架来部署完全合适。 关于机器配置,在挑挑拣拣评比之后,设备选择如下,最终选择的是其中的服务器配置。 这套设备下来总成本不到10万,相比如动辄几百万的满血版deepseek R1或者花个五六十万买个deepseek 70b的一体机要值当的多,且不说70b并不是真正的deepseek r1,效果还不如32b的QWQ,就光说一体机的升级也是个麻烦事,买了机器基本就和模型绑定了,以后新模型出来后想升级就难了。
4/3/2025 3:57:48 PM
贝塔街的万事屋
机器学习|从0开发大模型之复现DeepSeek的aha moment
前面一篇文章介绍了《从0开发大模型之DeepSeek的GRPO》,并且实现了一个简单版本的 GRPO 代码,不过从工程领域来看,并没有复现DeepSeek-R1,于是最近申请了48G的显存,结合一些开源的方案复现aha monent,并给出完整的代码和工具链。 1、什么是 aha monent DeepSeek-R1 论文中提到,模型让作者「见证了强化学习的力量和美感」,在DeepSeek-R1-Zero的中间版本,「顿悟时刻」来了:模型学会了以人类的语气进行反思。 aha monent 2、使用什么的基座模型和训练数据 由于显卡只有48G,可以用基座模型Qwen2.5,模型大小:0.5B,1.5B,3B训练数据有很多:(可以直接在huggingface上找到) a.AI-MO/NuminaMath-TIR:包括72K行的数学问题,解决方案和答案,是从 NuminaMath-CoT 数据集提炼出来的 b.
4/3/2025 3:46:53 PM
周末程序猿
机器学习|从0开发大模型之DeepSeek的GRPO
DeepSeek-R1的发布为国产大模型争光了(太强了),不过 GRPO 算法源自 DeepSeekMath 7B 模型,该模型在 MATH 基准测试中取得了优异成绩,论文发表于2024年2月份:,以下是该论文的摘要原文:复制翻译如下:复制对比数据1、什么是GRPOGRPO 是一种在线学习算法,核心思想是通过组内相对奖励来估计基线,从而避免使用额外的价值函数模型。 通过在训练期间使用受训模型自身生成的数据来迭代改进,GRPO 旨在最大化生成补全的优势,同时确保模型保持接近参考策略,下图是论文中的算法流程图:GRPOGRPO 是 PPO (Proximal Policy Optimization,近端策略优化,是一种强化学习算法,由OpenAI于2017年提出,旨在解决策略梯度方法中的训练不稳定问题) 的变体,主要区别是:GRPO 省略 value function modelGRPO 奖励计算,改成了一个 q 生成多个 r,然后 reward 打分GRPO算法流程:采样一组输出并计算每个输出的奖励对组内奖励进行归一化处理使用归一化后的奖励计算优势函数通过最大化目标函数更新策略模型迭代训练,逐步优化策略模型论文中的伪代码2、奖励设计huggingface 库提供 GRPOTrainer 可以直接使用 GRPO 训练,参数包括定义奖励模型和函数。 2.1 奖励模型复制这里的 reward_funcs 参数可以传入奖励模型。
4/3/2025 3:40:41 PM
周末程序猿
Anthropic 推动“AI 进校园”计划,将为高校师生提供定制版 Claude
“学习模式”(Learning Mode)是Claude Projects中的一项新功能,旨在帮助学生培养批判性思维,而不仅仅是直接获取答案。
4/3/2025 3:26:26 PM
清源
AI顾问成企业智能转型的战略军师与未来黄金职业
AI顾问协助公司识别、评估和盈利性地实施可能的AI应用场景。 他们不仅要考虑技术层面,还要考虑战略和企业层面要求——同时熟悉快节奏的AI领域中的最新趋势、创新和可能性。 但他们日常工作到底做什么呢?AI咨询:定义AI咨询涉及就AI解决方案提供建议、设计和实施。
4/3/2025 3:26:06 PM
René Kessler
OpenAI 持续迈步营利性公司,将组建专家小组听取各界意见、直面挑战
OpenAI 表示,该小组将广泛听取医疗、科学、教育和公共服务领域的意见,尤其是来自 OpenAI 总部所在的加利福尼亚州的行业领袖和社区代表。
4/3/2025 3:14:53 PM
清源
仅输入prompt与序列,准确率超90%,UC伯克利等提出文本生成蛋白质多模态框架
编辑丨coisini机器学习在蛋白质发现领域展现出深远的潜力,相关工具已快速应用于科学流程的辅助与加速。 当前,AI 辅助的蛋白质设计主要利用蛋白质的序列和结构信息,而为了描述蛋白质的高级功能,人们以文本形式整理了海量知识,这种文本数据能否助力蛋白质设计任务尚未得到探索。 为了填补这一空白,来自加州大学伯克利分校(UC Berkeley)、加州理工学院(California Institute of Technology)等机构的研究者提出了一个利用文本描述进行蛋白质设计的多模态框架 ——ProteinDT。
4/3/2025 2:37:00 PM
ScienceAI
53%性能全面提升,Ayu新模型横扫传统工具,分泌蛋白预测效率再翻倍
编辑丨&微生物是驱动元素循环的引擎,它们分泌蛋白质以寻求生活环境。 现阶段还缺乏有效的计算方法来研究分泌蛋白。 表征分泌组的另一种方法是将现代机器学习工具与蛋白质组对海洋环境的进化适应变化相结合。
4/3/2025 2:36:00 PM
ScienceAI