AI在线 AI在线

理论

ByteQC:通往大规模实用化量子化学计算的曙光

ByteQC:通往大规模实用化量子化学计算的曙光

编辑 | ScienceAI真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。 为了解决这一问题,近日字节跳动 ByteDance Research 团队开发并开源了 ByteQC ——基于 GPU 加速的大规模量子化学计算工具集。 该工具集使用强大的 GPU 算力,大幅度加速了常见的量子化学算法,同时结合领域内前沿的量子嵌入方法实现了量子化学「黄金标准」精度下的大规模量子化学体系的模拟。
3/5/2025 12:56:00 PM ScienceAI
OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员

OpenAI开价385万年薪扩增机器人团队!招募基础模型人才,北大校友是创始成员

年薪最高53万美元,OpenAI机器人团队,叒叒叒招人了! 最新消息,OpenAI正在招募机器人底层技术模型开发人员,年薪29.5-53万美元(约合人民币214-385万)。 将这一消息广而告之的,是重启后的OpenAI机器人团队创始成员、卡内基梅隆大学华人博士林星宇。
3/5/2025 11:26:33 AM 量子位
OpenAI计划将Sora整合到ChatGPT中

OpenAI计划将Sora整合到ChatGPT中

3月4日消息,2024年初,OpenAI宣布将Sora作为其首款人工智能文本转视频生成器。 ChatGPT的母公司在2024年12月发布了稳定版本。 现在,OpenAI透露,他们计划将Sora的视频生成器功能集成到ChatGPT中。
3/5/2025 11:23:44 AM Yu
AI幻觉扰乱法庭,美国律师被重罚

AI幻觉扰乱法庭,美国律师被重罚

继上月曝出律师团队使用AI编造的“虚假判例”提交法庭引发风波后,美国法律界再曝同类丑闻——印第安纳州南区联邦治安法官马克·丁斯莫尔上周裁定,律师拉斐尔·拉米雷斯因在多份法律文书中引用AI生成的虚构案例,需缴纳1.5万美元罚款。 这一系列事件暴露AI技术滥用对司法严谨性的冲击,也为法律从业者敲响“责任警钟”。 律师称“没想到AI居然会造假”案件缘起于一场劳资纠纷:工会组织“中中部运营工程师健康与福利基金”指控HoosierVac公司拒绝配合财务审计,拉米雷斯作为该公司代理律师,在2023年10月提交的辩护状中引用了一则法官无法检索到的判例。
3/5/2025 11:09:20 AM 佚名
一文读懂:DeepSearch 前生今世

一文读懂:DeepSearch 前生今世

众所周知,在当今信息爆炸的时代,如何从海量数据中高效、精准地提取有价值的内容,成为人工智能领域的重要课题。 DeepSearch 作为一种创新的迭代搜索系统,以其独特的循环推理机制和强大的信息挖掘能力,逐渐崭露头角,成为解决复杂查询与研究需求的利器。 本文将带大家深入探索 DeepSearch 的前世今生——从其概念的萌芽、技术原理的演进,到如今在智能搜索与知识生成领域的广泛应用。
3/5/2025 11:03:36 AM 架构驿站
DeepSeek对数据治理的影响

DeepSeek对数据治理的影响

DEEPSEEK作为智能一款助手,在数据治理体系中具有深远的影响。 它通过提供智能化、自动化和高效化的解决方案,推动企业在数据治理变革与领域的优化。 以下是EPSEEK对数据治理体系影响的多角度分析: 一、战略层面:推动数据治理目标的明确与实现1.
3/5/2025 10:29:12 AM 佚名
显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

显著超越SFT,o1/DeepSeek-R1背后秘诀也能用于多模态大模型了

o1/DeepSeek-R1背后秘诀也能扩展到多模态了! 举个例子,提问多模态大模型:“什么宝可梦可以释放技能十万伏特”时,模型通过推理过程准确找出皮卡丘对应的坐标框,展示出模型的泛化能力。 这是来自上海交大、上海AI Lab、港中文大学的研究人员推出的视觉强化微调开源项目——Visual-RFT (Visual Reinforcement Fine-Tuning), 只需10~1000条数据,就能通过思考过程和基于规则的监督提升多模态大模型的性能。
3/5/2025 10:21:04 AM 量子位
为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力

为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力

我们都知道,DeepSeek-R1 的训练过程使用了一种名为专家混合模型(Mixture-of-Experts, MoE)的技术,而当前的 MoE 技术依然还有显著的优化空间。 近日,美国西北大学计算机科学博士生王子涵(Zihan Wang)等人在这个方向上取得了突破,提出了一种名为专家链(CoE)的技术。 实验表明,CoE 在性能、扩展策略、资源效率和专家使用效率等多个方面都显著超越先前的 MoE 模型。
3/5/2025 9:50:00 AM 机器之心
普特南数赛公布,MIT创5连冠神话!3位00后华人称霸TOP 5

普特南数赛公布,MIT创5连冠神话!3位00后华人称霸TOP 5

普特南数学竞赛,结果出炉! MIT再次成为全世界的焦点,连续5年夺冠,5位本科生科横扫榜单TOP 5。 其中,有三位00后华人学生。
3/5/2025 9:40:00 AM 新智元
GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5,口碑又意外反转了? 经过3千多轮比较,GPT-4.5在全部类别拿下第一,位居LLM竞技场首位! 「不看智商看情商」的GPT-4.5,不是推理模型,此前的基准测试中基本都是全班垫底,惨不忍睹。
3/5/2025 9:32:00 AM 新智元
小模型:传统行业智能化转型的“轻量级引擎”

小模型:传统行业智能化转型的“轻量级引擎”

一、生成式AI浪潮下,传统行业CIO的“务实革命”当全球企业竞逐千亿参数大模型时,制造业、医药、能源等传统行业的CIO们正悄然发起一场“务实革命”——与其追逐算力军备竞赛,他们更关注如何让AI真正落地车间、实验室与供应链。 面对高昂的GPU集群投入、复杂的数据合规要求,以及垂直场景的碎片化需求,企业技术决策者开始重新审视技术路径:能否以更轻量的方式,撬动智能化转型?小模型(Small Language Models, SLM)的崛起,恰恰击中了这一痛点。 相较于“大而泛”的通用大模型,参数规模通常小于10亿的小模型凭借轻量化架构、领域精调能力和边缘端部署优势,正成为传统行业的“轻量级引擎”。
3/5/2025 9:30:00 AM
Warp vs. Ghostty:哪个终端应用更符合你的开发需求?

Warp vs. Ghostty:哪个终端应用更符合你的开发需求?

Warp 拥有许多功能,包括 AI,而 Ghostty 则在开箱即用方面更轻量级。 以下是我们关于哪个终端应用程序最适合您的指南。 译自Warp vs.
3/5/2025 8:58:53 AM 岱军
Microsoft Dragon Copilot:医疗领域的 AI 革命

Microsoft Dragon Copilot:医疗领域的 AI 革命

在医疗行业,医生和护士们常常被繁重的文书工作压得喘不过气来,这不仅影响了他们的工作效率,还可能影响到患者体验。 现在,Microsoft 推出了一款名为 Dragon Copilot 的 AI 助手,旨在帮助医疗专业人员简化临床工作流程,让他们能够更多地关注患者护理。 下面,就让我们一起来了解一下这款革命性的产品。
3/5/2025 8:56:31 AM 深海幽光
GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

基础模型竞争又紧张刺激起来了! GPT-4.5刚登顶竞技场且全任务分类第一名,6小时后总榜就被马斯克的新版Grok-3反超。 两者都是获得3000 票数,总分1412:1411只差一分。
3/5/2025 8:50:00 AM 量子位
DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

大模型刷榜 MMLU、屠榜 GPQA 的玩法一夜变天? ? ?
3/5/2025 8:40:00 AM 量子位
实测字节免费AI编程,还让不让Cursor活了

实测字节免费AI编程,还让不让Cursor活了

国内首个原生AI IDE(集成开发环境),来自字节,实测在此:哪怕一点代码都不懂,只要能说出自己的需求,就能靠AI开发出一个功能完备的应用。 例如如果你想做一个Flappy Bird游戏,那就用中文跟它说一声就行:生成一个网页版 Flappy Bird游戏并运行。 不难看出啊,整个过程真真儿的就是一气呵成。
3/5/2025 8:30:00 AM 量子位
经网络的每一层都是干嘛的?这才是神经网络结构的核心

经网络的每一层都是干嘛的?这才是神经网络结构的核心

组成一个神经网络从技术上来说主要有以下几个部分:数据集神经网络结构损失函数优化函数反向传播而不同神经网络模型之间最主要的区别就是神经网络结构的异同,当然最相似的地方也是神经网络结构。 原因就在于神经网络结构是由多个神经网络层所组成的;而使用不同的层就实现了不同功能的神经网络模型。 神经网络的层一个神经网络是由多种神经网络层所组成的,而每个神经网络层实现不同的功能;然后由此组成神经网络模型。
3/5/2025 8:00:00 AM AI探索时代
全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法

全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法

用户已经习惯于将大模型如ChatGPT、Llama-3-chat等当作聊天对象,然而在用户和聊天助手的会话中,有的用户提示(例如一些命令或请求)不能在一轮会话中结束,需要大语言模型和用户进行多轮会话。 这种跨越多轮的会话目前仍然存在一些问题:大语言模型的回答容易出错,不能帮助用户达到目标,且随着会话轮数增加出错概率会增大。 对同一个命令或问题,大语言模型比较难以根据实际需求产生不同流程的响应,在需要大语言模型与环境交互时,目前比较流行的做法是使用函数调用或工具调用,但不够优雅和高效,而且由于上下文窗口的限制,能支持的工具调用数量有限。
3/5/2025 4:00:00 AM 新智元