应用
医疗 AI 迎来大考,南洋理工发布首个 LLM 电子病历处理评测
电子病历(EHR)是医疗体系中最核心的数据形态,集中呈现患者在诊断、检验、用药、生命体征监测与疾病管理过程中的关键临床信息,是临床决策的重要基础。 随着 LLM 逐步应用于医疗场景,如何使其有效理解和处理这些结构化的 EHR,从而辅助医生完成关键的数据分析与临床推理,已成为推动医疗人工智能发展的重要问题。 因此,南洋理工大学的研究人员提出了首个全面评测 LLM 处理结构化电子病历能力的综合基准 EHRStruct,由计算机科学家与医学专家共同构建,并按照临床场景、认知层级与功能类别进行层次化组织,全面的覆盖了 LLM 处理结构化 EHR 的 11 项核心任务,包含 2,200 个标准化样本,为医疗大模型的可控性、可靠性与临床可用性提供统一而严谨的可解释评测框架。
未来的 AI 在盯着你!Andrej Karpathy 的 Hacker News 十年回顾实验
前 OpenAI 首席科学家 Andrej Karpathy 决定用一种独特的方式来回顾过去。 他的最新实验将目光聚焦于2015年 Hacker News 的930条讨论,通过现代的人工智能技术进行自动评分。 这项工作不仅展现了 AI 的强大能力,更引发了关于未来公共表达的重要思考。
千问App校园走红:功能全免费,学生一年省下一个iPad
近日,阿里巴巴旗下千问App宣布将学习、文档等核心能力向用户免费开放,这一举措很快在高校学生群体中引发关注。 多名学生在社交平台分享称,如果将PPT制作、资料下载、翻译、文档写作等常用工具的订阅费用叠加计算,千问的免费策略一年可以帮他们省下最高2000元的会员开支。 一些学生表示,为了完成一个课题常常要在多个App之间来回切换:用PPT模板要开会员、查资料要付费下载,格式转换、论文排版又各有各的付费入口,“为了交一次作业临时开一次会员”几乎成了日常。
Thinking Machines首款产品重大更新:K2 Thinking、Qwen3-VL都可以微调了
当前,AI 领域的研究者与开发者在关注 OpenAI、Google 等领先机构最新进展的同时,也将目光投向了由前 OpenAI CTO Mira Murati 创办的 Thinking Machines Lab。 今年早些时候,他们推出了首款产品 Tinker:这是一个 API,用于帮开发者 / 研究人员微调语言模型。 你只需要专注于训练数据和算法,而你不擅长的关于 Infra 的部分 —— 调度、调优、资源管理和 Infra 可靠性 —— 统统由 Tinker 来搞定,从而大大简化了 LLM 的后训练过程。
蚂蚁数科宣布开源数据分析智能体技术,当前登顶BIRD
12月13日,第二届CCF中国数据大会上,蚂蚁数科宣布开源旗下数据智能体关键技术Agentar SQL全套论文、代码、模型和使用指南。 该智能体技术可让非专业人员通过日常语言进行商业数据查询和分析,为企业数智化提供更精准可用的智能数据分析基座。 蚂蚁数科首期开源实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供一套开箱即用的数据查询方案,提升文本与数据库查询交互效率。
阿里推出新语音模型“百聆”:三秒录音实现多语言与情感切换
阿里巴巴通义大模型宣布,其 “百聆” 系列语音模型迎来了重大升级,并正式开源。 此次更新的两款语音模型,能够在仅需三秒的录音后,实现无缝切换至多达九种语言和十八种方言,包括普通话、粤语、日语、英语等,同时还可以模拟多种情感如开心和愤怒。 在这次升级中,Fun-CosyVoice3模型得到了显著改善。
商汤发布行业首个“多剧集生成智能体”Seko2.0,国产AI芯片首次打通多模态AIGC全链路
商汤科技正式推出Seko2.0——全球首个专注于多剧集视频生成的智能体,标志着AI视频生成从单片段创作迈向连续叙事的新阶段。 该系统能够生成角色、场景、风格高度一致的多集短视频内容,在剧情连贯性、人物稳定性与视觉统一性上实现行业突破,为短剧、广告、教育等场景提供可规模化的AI内容生产方案。 0 的背后,是商汤自研“日日新Seko”系列多模态大模型的深度协同。
一行AI指令摧毁整台Mac!Claude CLI工具误删用户主目录,开发者多年心血瞬间清零
一场由AI助手引发的数字灾难,再次敲响了自动化工具安全性的警钟。 12月8日,开发者LovesWorkin在Reddit上发帖痛诉:自己仅是想用Anthropic推出的Claude CLI编程工具清理旧代码仓库,却因AI生成的一行命令,导致整台Mac电脑主目录被彻底清空——桌面、文档、下载文件夹、钥匙串、应用数据乃至Claude自身凭证全部消失,多年积累的工作成果几近归零。 问题出在Claude CLI执行的这条命令上: `rm -rf tests/ patches/ plan/ ~/`表面看,这是在删除几个项目目录,但致命错误藏在末尾的 `~/` ——在Unix/Linux系统中,`~` 代表当前用户的主目录(如 `/Users/username`)。
全球人工智能竞争力排名出炉:美国夺冠,中国紧随其后!
近日,斯坦福大学发布了全球人工智能活力工具(Global AI Vibrancy Tool)的最新数据,揭示了全球人工智能竞争力排名前30位的国家。 根据这份评估,综合考虑了各国在研究成果、投资、人才吸引和治理框架等多个维度的表现,美国凭借强大的私人投资、学术研究和活跃的初创企业位居第一。 中国紧随其后,表现同样不俗。
国际体育赛事首次,奇瑞“墨茵”机器人于 2025 亚青残运会完成颁奖首秀
AI在线 12 月 15 日消息,据奇瑞集团官方,迪拜当地时间 12 月 12 日,在 2025 亚洲青年残运会(AYPG)举重项目颁奖仪式上,奇瑞机器人墨茵(Mornine)与机器狗(Argos),与亚洲残奥委员会首席执行官 Tarek Souei,共同为冠军运动员颁授金牌。 这标志着机器人首次在国际综合性体育赛事中承担颁奖任务。 据悉,本届赛事期间,墨茵(Mornine)还将继续协助完成后续比赛的颁奖工作。
连续俩月霸榜全球第一的数据分析智能体,终于开源啦!
12月13日,第二届CCF中国数据大会上,蚂蚁数科宣布开源旗下数据智能体关键技术Agentar SQL全套论文、代码、模型和使用指南。 该智能体技术可让非专业人员通过日常语言进行商业数据查询和分析,为企业数智化提供更精准可用的智能数据分析基座。 蚂蚁数科首期开源实时文本转化结构化查询语言(Text-to-SQL)框架,为开发者提供一套开箱即用的数据查询方案,提升文本与数据库查询交互效率。
Tenstorrent 裁员 7.5%!重心转向个人开发者,AI 芯片发展计划调整
知名 AI 芯片企业 Tenstorrent 宣布进行了一轮裁员,裁员规模达到7.5%,员工总数降至约1000人。 这一举措由首席执行官 Jim Keller 主导,他在接受 EETimes 采访时表示,此次裁员是针对整个公司层面的调整,并不是集中在某个特定部门。 Keller 指出,裁员的主要原因在于员工的技能、心态和团队匹配度,而并非出于财务方面的压力。
谷歌打通AI与个人知识库:NotebookLM深度集成Gemini,让AI真正“记住”你的工作上下文
谷歌正将AI助手从通用问答工具,转变为真正理解你个人工作脉络的智能协作者。 近日,该公司正式推出NotebookLM与Gemini的深度集成功能,允许用户在与Gemini对话时,直接调用自己在NotebookLM中创建的笔记、文档和知识库作为交互上下文。 这意味着,Gemini不再仅依赖其训练数据或当前对话内容进行回应,而是能“读取”你精心整理的项目资料、会议纪要、研究摘要或学习笔记,从而提供高度个性化、上下文精准的答案。
蚂蚁集团健康应用 AQ 更名为 “阿福”,月活用户突破 1500 万
蚂蚁集团旗下的 AI 健康应用 AQ 近日宣布更名为 “蚂蚁阿福”,同时推出了全新版本的 App。 此次升级主要围绕健康陪伴、健康问答和健康服务三个核心功能进行优化。 根据官方数据,目前 “蚂蚁阿福” 的月活跃用户已超过 1500 万,成为国内首屈一指的健康管理 AI 应用。
国产芯片也能跑AI视频实时生成了,商汤Seko 2.0揭秘幕后黑科技
自 Sora 2 发布以来,各大科技厂商迎来新一轮视频生成模型「军备竞赛」,纷纷赶在年底前推出更强的迭代版本。 谷歌推出 Veo 3.1,通过首尾帧控制和多图参考解决了以往视频生成「抽卡」随机性太强的问题;Runway 拿出 Gen-4.5,强化了物理模拟和表情动作迁移;快手祭出 Kling 2.6,实现了原生音画同步……各家都在炫技,但一个更本质的问题却常被忽略:这些模型距离真正的生产力工具,究竟还有多远? 12 月 15 日,商汤科技产品发布周正式开启,第一天就重磅上线了全新的 Seko 2.0 版本,让 AI 短剧创作真正实现「一人剧组」。
小米首席语音科学家 Daniel Povey:AI 发展的本质就像生物进化,不开源要慢 1000 倍
从生物进化的漫长历程到 AI 技术的疯狂迭代,两者遵循着惊人相似的底层逻辑。 在探寻下一代 AI 架构的关键时刻,著名的“Kaldi 之父”、小米集团首席语音科学家、IEEE Fellow Daniel Povey 提出:就像生物进化一样,AI“配方”的设计本质上就是一个不断试错的过程,而进化的速度,取决于“复制”一个新想法所需的时间。 在本次量子位 MEET2026 智能未来大会上,他也将开源视为 AI 进化的核心加速器 ——若没有开源,行业的进化速度恐怕要慢上一千倍;正是因为有了开源,技术才能像生物适应新环境一样,经历“长期停滞 瞬间爆发”的非线性跃迁。
阿里通义百聆推出语音模型新版本:3 秒录音即可“复制”9 种语言、18 种方言
AI在线 12 月 15 日消息,今天下午,通义大模型通过官方公众号宣布,两款“百聆”语音模型正式开源,两款模型迎来升级。 根据介绍,其只需 3 秒录音,就能让你的声音无缝切换语种、方言与情绪 —— 普通话、粤语、日、英、开心、愤怒……9 种通用语言、18 种方言,通通搞定。 升级Fun-CosyVoice3 模型升级:首包延迟降低 50%,中英混字准确率翻倍,支持 9 语种 18 方言口音、跨语种克隆与情感控制;Fun-ASR 模型能力增强:噪声场景准确率 93%、支持歌词与说唱识别、31 语种自由混说、方言口音覆盖,并将流式识别模型的首字降低到 160ms。
何恺明组三位本科生领衔!持续聚焦Flow模型,突破归一化流生成效率瓶颈
鱼羊 发自 凹非寺. 量子位 | 公众号 QbitAI何恺明团队新作,持续聚焦Flow模型。 与MeanFlow对流匹配的优化不同,这次主要旨在解决归一化流在生成模型中的局限。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉