AI在线 AI在线

资讯列表

大模型赋能文化遗产数字化:古籍修复与知识挖掘的技术实践

在文化遗产数字化领域,大模型的核心应用难点在于如何处理古籍中大量的异体字、残缺文本与模糊语义,尤其是面对明清时期的手写残卷,传统的文字识别技术不仅准确率低下,更无法理解古籍中蕴含的历史语境与专业术语。 我在参与某博物馆古籍数字化项目时,首先遭遇的便是大模型对古籍文字的“识别盲区”—初期使用通用大模型识别一本明代医学残卷,发现其将“癥瘕”误判为“症痕”,把“炮制”错解为“泡制”,更无法关联“君臣佐使”等中医方剂配伍逻辑,导致提取的知识完全偏离原意。 为解决这一困境,我没有直接进行模型微调,而是先搭建“古籍文字与语境知识库”:通过整理《说文解字》《康熙字典》等权威字书,以及近现代古籍整理学术成果,构建包含5000 异体字、通假字的对照词典,每个文字标注字形演变、常见语境与释义差异;同时,针对医学、天文、历法等专业领域古籍,收集对应的行业术语库,标注术语的历史用法与现代对应概念(如“勾陈”对应天文领域的“小熊座”)。
10/13/2025 6:10:28 PM
许辉

推理速度10倍提升,蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

近日,蚂蚁集团正式开源业界首个高性能扩散语言模型(Diffusion Large Language Model,dLLM)推理框架 dInfer。 在基准测试中,dInfer 将 dLLM 的推理速度相比于 Fast-dLLM 提升了 10 倍以上,并在关键的单批次(batch size=1)推理场景下,作为首个开源框架实现了大幅超越经过高度优化的自回归(AR)模型的性能里程碑,在 HumanEval 上达到 1011 tokens / 秒的吞吐量 。 dInfer 通过一系列算法与系统协同创新,攻克了 dLLM 的推理瓶颈,兑现了其内生并行生成带来的推理效率潜力。
10/13/2025 5:40:00 PM
机器之心

​OpenAI 与微软达成重磅交易:股权结构再变,投资者面临稀释风险

《金融时报》报道了 OpenAI 近期一系列重要交易,这些交易让公司的股权结构变得更加复杂,也令投资者对于未来的回报更加不确定。 根据这些交易,OpenAI 成为了全球最有价值的非上市公司,估值高达5000亿美元。 这一成果主要得益于与芯片制造商英伟达和 AMD 签订的数十亿美元合同,这些资金将助力 OpenAI 在未来几年实现部署1万亿美元算力的目标。
10/13/2025 5:32:05 PM
AI在线

蘑菇车联加速AI商业化 前滴滴高管付强加盟任总裁

近日,智能交通与AI基础设施公司蘑菇车联发布内部公开信,宣布重大人事任命:原滴滴高级副总裁付强正式加入公司,出任总裁一职。 他将全面负责蘑菇车联AI业务的战略落地与商业化布局。 付强在智能出行领域拥有超过十年的丰富经验。
10/13/2025 5:32:05 PM
AI在线

OpenAI联手阿根廷,投资250亿美元打造超级数据中心

近日,OpenAI 与阿根廷能源公司 Sur Energy 签署了一项意向书,计划在阿根廷投资高达250亿美元,建设一个规模庞大的数据中心。 这一项目不仅是阿根廷历史上最大的信息技术和能源基础设施项目之一,还将为该国的科技发展注入新的动力。 根据协议,这座数据中心将具备500兆瓦的计算能力,专门支持先进的人工智能计算。
10/13/2025 5:32:03 PM
AI在线

Perplexity CEO 宣布告别 PPT,借助 AI 实现投资者路演新模式

在人工智能技术不断发展的今天,许多传统商业活动也在悄然发生变化。 近日,AI 搜索工具 Perplexity 的联合创始人兼 CEO 阿拉文德・斯里尼瓦斯在伯克利哈斯商学院的采访中表示,他已经放弃了传统的融资演示文稿(PPT),转而使用人工智能来完成投资者路演。 图源备注:图片由AI生成,图片授权服务商Midjourney斯里尼瓦斯提到,自己在 A 轮融资时仅制作了一次路演幻灯片,而之后的融资活动都依赖于 AI 的协助。
10/13/2025 5:32:01 PM
AI在线

马来西亚迎来 AI 新纪元,ChatGPT Go 助力数字化转型

近日,OpenAI 在马来西亚推出了全新的 ChatGPT Go 订阅服务,月费仅为38.99马币(约9.25美元),大幅降低了 AI 高级功能的使用门槛。 此次推出的 ChatGPT Go 不仅包括了最新的 GPT-5模型,还提供了丰富的功能,如图片生成、文件上传及记忆功能,极大地提升了用户的体验。 这一举措正值马来西亚 AI 用户数量在过去一年中激增的背景下进行,OpenAI 希望通过更亲民的价格吸引中端用户和学生,进而扩展用户基础。
10/13/2025 5:31:58 PM
AI在线

拒绝“熵崩塌”和“熵爆炸”!这项研究让大模型推理成绩飙升

大语言模型在RLVR训练中面临的“熵困境”,有解了! 2024年以来,以OpenAI o1、DeepSeek-R1、Kimi K1、Qwen3等为代表的大模型,在数学、代码和科学推理任务上取得了显著突破。 这些进展很大程度上得益于一种名为RLVR (基于可验证奖励的强化学习)的方法。
10/13/2025 5:12:43 PM
一水

Sora2“复活”已故名人,家属强烈反对

时令 发自 凹非寺. 量子位 | 公众号 QbitAISora 2的迅速走红,让肖像权问题再次成为焦点。 毕竟有的人为了博取流量和讨论度,甚至不惜用已故名人生成视频。
10/13/2025 5:06:50 PM
时令

推理性能提升10倍!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

10月13日,蚂蚁集团正式开源业界首个高性能扩散语言模型推理框架dInfer。 在基准测试中,dInfer将扩散语言模型的推理速度相比于英伟达扩散模型框架Fast-dLLM提升了10.7倍;在代码生成任务HumanEval上,dInfer在单批次推理中创造了1011Tokens/秒的速度,首次在开源社区中实现扩散语言模型的单批次推理速度显著超越自回归模型。 dInfer的工作表明,扩散语言模型具备显著的效率潜力,可以通过系统性的创新工程兑现,为通往AGI的架构路径提供极具竞争力的选项。
10/13/2025 5:04:05 PM
henry

谷歌重磅发布Gemini 2.5 Computer Use - AI代理首次实现真正的计算机控制

就在今年早些时候,谷歌曾承诺要通过Gemini API为开发者带来计算机使用能力。 如今,这个承诺终于兑现了。 谷歌DeepMind正式发布了Gemini 2.5 Computer Use模型,这是一个基于Gemini 2.5 Pro视觉理解和推理能力构建的专用模型,能够驱动AI代理与用户界面进行真正的交互。
10/13/2025 3:54:12 PM
阿丸笔记

刚得诺奖的成果被做成芯片了

谁说获得诺贝尔化学奖的MOF(金属有机框架)“无用”? 这种几十年前被嫌弃“只有理论但缺乏实际应用”的新材料,前脚刚获得诺奖认可,后脚就被做成芯片! 这就是莫纳什大学的科学家们刚刚发布的最新成果——用MOF制造超迷你的流体芯片。
10/13/2025 3:53:23 PM

2025 全球十大工程成就揭晓:DeepSeek入选

近日,由中国工程院院刊《Engineering》主办的 “2025全球十大工程成就” 评选结果正式公布。 这一评选旨在表彰近五年内完成并取得全球性影响的重大工程科技创新成果。 经过全球范围内的提名征集、专家推荐、公众问卷调查以及评选委员会的审议,最终选出了十项具有重要意义的工程成就。
10/13/2025 3:21:18 PM
AI在线

Claude Code 插件功能上线,助力开发者提升编程效率

近日,AI 编程助手 Claude Code 的开发公司 Anthropic 宣布,推出全新 “插件” 功能,正式进入公开测试阶段。 这一功能旨在为开发者提供更强大的自定义能力,帮助他们在使用 Claude Code 时,像在 VS Code 中安装扩展插件一样,快速添加所需工具和功能,提升工作效率。 新推出的插件系统分为四大核心组件。
10/13/2025 3:21:16 PM
AI在线

vivo新战略:聚焦端侧AI,手机智能化再升级!

在2025年的 vivo 开发者大会上,vivo 副总裁兼 AI 全球研究院院长周围分享了公司在智能手机领域的最新进展,尤其是端侧 AI 的突破。 随着技术的发展,手机制造商正逐渐将重心从庞大的云端大模型转向更轻便的端侧大模型。 这种转变不仅能够提升用户体验,也为手机差异化竞争提供了新机会。
10/13/2025 3:21:15 PM
AI在线

马斯克挖角 NVIDIA 核心团队,xAI 加速 “世界模型” 研发

埃隆・马斯克的人工智能公司 xAI 正在全力推进 “世界模型” 的开发,这一技术被认为是实现通用人工智能(AGI)的重要途径。 为了加快这一进程,xAI 从竞争对手 NVIDIA 挖来了两名核心研究员 ——Zeeshan Patel 和 Ethan He。 两位新加入的团队成员都在 NVIDIA 的 Omniverse 平台中发挥了重要作用,为 xAI 的研发带来了宝贵的经验和技术支持。
10/13/2025 3:21:15 PM
AI在线

改变强化学习范式,Meta新作呼应Sutton「经验时代」预言

从数据时代到经验时代,怎么平滑过渡? Meta提出了新见解。 前段时间,图灵奖得主 Richard Sutton 与谷歌 RL 大佬 David Silver 合作撰写的《Welcome to the Era of Experience(欢迎来到经验时代)》引发了广泛关注。
10/13/2025 2:51:00 PM
机器之心

LLaVA-OneVision-1.5全流程开源,8B模型预训练只需4天、1.6万美元

LLaVA 于 2023 年提出,通过低成本对齐高效连接开源视觉编码器与大语言模型,使「看图 — 理解 — 对话」的多模态能力在开放生态中得以普及,明显缩小了与顶级闭源模型的差距,标志着开源多模态范式的重要里程碑。 LLaVA 用低成本对齐打通「视觉编码器 大语言模型」起步,LLaVA‑1.5 以更大更干净的数据与高分辨率输入强化理解,LLaVA‑NeXT 拓展 OCR / 数理与多场景任务;随后分支为 LLaVA‑NeXT‑Video 处理时序视频、多帧推理,及 LLaVA-NeXT-Interleave 支持交替多图文与跨图联推;最终在 LLaVA‑OneVision 汇聚为统一接口,覆盖图像 / 文档 / 图表 / 多图 / 视频,兼顾效果与效率。 尽管多模态对齐的接口与架构趋于收敛,真正「可复现」的开源路径仍与「仅开放权重」存在间距。
10/13/2025 2:48:00 PM
机器之心