资讯列表
Midjourney 发布 AI 图片生成模型 V7,可“吟唱”生图
在“草图模式”下,用户可以使用语音识别生成功能,只需要在启用“草图模式”后点击麦克风图标,即可通过语音实时塑造图片。
4/4/2025 4:46:34 PM
潞源(实习)
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
这会是 DeepSeek R2 的雏形吗? 本周五,DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。 当前,强化学习(RL)已广泛应用于大语言模型(LLM)的后期训练。
4/4/2025 1:56:00 PM
机器之心
250多篇论文,上海AI Lab综述推理大模型高效思考
最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning Models,LRMs)通过加长「思考链」(Chain-of-Thought,CoT)在推理任务上表现惊艳。 但随之而来的是一个日益严重的问题:它们太能「说」了! 生成的推理过程往往充斥着冗余信息(比如反复定义)、对简单问题过度分析,以及对难题的探索浅尝辄止。
4/4/2025 1:47:00 PM
机器之心
多榜单登顶!华为 & 哈工深团队提出 AdaReTaKe,突破长视频理解极限
第一作者为哈尔滨工业大学(深圳)博士生王霄和华为大模型研究员佀庆一,该工作完成于王霄在华为实习期间。 王霄的研究方向为多模态视频理解和生成,佀庆一的研究方向为多模态理解、LLM post-training和高效推理。 随着视频内容的重要性日益提升,如何处理理解长视频成为多模态大模型面临的关键挑战。
4/4/2025 1:39:00 PM
机器之心
移动通信领域有了新 SOTA:华为出品,精准预测用户行为
华为 GTS 部门 AI 算法团队提出 GTS-LUM,实现移动通信用户精准行为洞析与多跳预测,实验中效果大幅优于 Meta 的 HSTU 和字节的 HLLM。
4/4/2025 12:37:42 PM
汪淼
GPT-4.5 创造力比 GPT-4o 弱,浙大上海 AI Lab 发布全球首个面向真实场景的多模态创造力评测基准
Creation-MMBench 基准覆盖四大任务类别、51 项细粒度任务,用 765 个高难度测试案例,为 MLLMs 的“视觉创意智能”提供全方位体检。
4/4/2025 12:18:37 PM
汪淼
谷歌拉响通用人工智能警报,首次公开 AI 安全防御蓝图
DeepMind 认为 AGI 即将落地,主张立即行动。AGI 可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。
4/4/2025 10:25:49 AM
故渊
皮尤公布美国 AI 威胁职业清单:收银员和记者风险较高,心理咨询师影响最小
皮尤研究中心最新调查显示,美国公众与AI专家对人工智能影响的预期存在显著差异:56%专家看好AI未来20年的积极影响,公众支持率仅17%。性别差异在专家群体中更突出,双方对就业影响判断也不同。#人工智能##AI影响#
4/4/2025 10:02:03 AM
故渊
Claude 3.5首战复现21%顶会论文,人类博士无法取代!OpenAI:AI全是草台班子
AI智能体,能否复现顶会中重磅的AI研究? 今天,OpenAI团队发布了全新框架PaperBench,便可评估AI智能体复现顶尖研究的基础能力。 论文地址:,AI智能体需从0开始复现20篇ICML 2024 Spotlight和Oral论文,包括理解论文核心文献、开发可运行代码库,以及执行实验并验证结果。
4/4/2025 12:00:00 AM
新智元
联合国预计 2033 年 AI 市场规模将达到 4.8 万亿美元,比肩德国经济
人工智能成为数字化转型的重要力量,其收益仍然高度集中。当前,人工智能的基础设施和专业知识的获取仍然集中在少数几个经济体,仅100家公司(主要集中于中美两国)就占了全球企业研发支出的40%。
4/3/2025 9:20:12 PM
清源
实测完即梦3.0,我后悔大学选了设计专业……
编辑 | 杨文自从 GPT-4o 出了「吉卜力」滤镜后,社交媒体上简直是人均宫崎骏。 而这股「吉卜力热」也让 ChatGPT 圈了一大波粉,甚至一小时狂揽百万用户。 友商们也坐不住了。
4/3/2025 6:42:00 PM
AI好好用
天津中小学今年将新开《人工智能基础》地方课程,每周 1 课时
小学低年级段侧重感知和体验人工智能技术,小学高年级段和初中阶段侧重理解和应用人工智能技术,高中阶段侧重项目创作和前沿应用。
4/3/2025 5:32:51 PM
清源
速来!机器之心ICLR 2025新加坡现场人才晚宴开启报名
2025 年开年,以 DeepSeek R1 为代表的推理大模型开启炸场模式。 在短短数月内,DeepSeek 凭借其卓越的性能和广泛的适用性,迅速在人工智能领域掀起了一场技术革新的浪潮。 而后,国内外各大科技公司、科研机构迅速跟进,新研究、新应用不断涌现。
4/3/2025 5:21:00 PM
机器之心
DeepResearcher:交大、SII发布首个真实环境强化学习「AI研究者」模型
上海交通大学与 SII 联合发布了 DeepResearcher,代码训练框架完全开源。 这是首个在真实网络环境中通过强化学习训练的 AI 研究模型。 随着大型语言模型(LLMs)推理能力的飞速发展,OpenAI、Google 和 XAI 等科技巨头纷纷推出了备受欢迎的 Deep Research 产品。
4/3/2025 5:18:00 PM
机器之心
RAG实战|向量数据库LanceDB指南
LanceDB介绍LanceDB是一个开源的用 Rust 实现的向量数据库(),它的主要特点是:提供单机服务,可以直接嵌入到应用程序中支持多种向量索引算法,包括Flat、HNSW、IVF等。 支持全文检索,包括BM25、TF-IDF等。 支持多种向量相似度算法,包括Cosine、L2等。
4/3/2025 4:02:14 PM
周末程序猿
仅需10万不到,DeepSeek R1 671B大模型本地部署实战指南
最近帮一个朋友部署本地的671b版本的deepseek r1,需求是要完全本地部署,但是又不想花太高的成本,没有并发要求,我一想,用ktransformers框架来部署完全合适。 关于机器配置,在挑挑拣拣评比之后,设备选择如下,最终选择的是其中的服务器配置。 这套设备下来总成本不到10万,相比如动辄几百万的满血版deepseek R1或者花个五六十万买个deepseek 70b的一体机要值当的多,且不说70b并不是真正的deepseek r1,效果还不如32b的QWQ,就光说一体机的升级也是个麻烦事,买了机器基本就和模型绑定了,以后新模型出来后想升级就难了。
4/3/2025 3:57:48 PM
贝塔街的万事屋
机器学习|从0开发大模型之复现DeepSeek的aha moment
前面一篇文章介绍了《从0开发大模型之DeepSeek的GRPO》,并且实现了一个简单版本的 GRPO 代码,不过从工程领域来看,并没有复现DeepSeek-R1,于是最近申请了48G的显存,结合一些开源的方案复现aha monent,并给出完整的代码和工具链。 1、什么是 aha monent DeepSeek-R1 论文中提到,模型让作者「见证了强化学习的力量和美感」,在DeepSeek-R1-Zero的中间版本,「顿悟时刻」来了:模型学会了以人类的语气进行反思。 aha monent 2、使用什么的基座模型和训练数据 由于显卡只有48G,可以用基座模型Qwen2.5,模型大小:0.5B,1.5B,3B训练数据有很多:(可以直接在huggingface上找到) a.AI-MO/NuminaMath-TIR:包括72K行的数学问题,解决方案和答案,是从 NuminaMath-CoT 数据集提炼出来的 b.
4/3/2025 3:46:53 PM
周末程序猿