资讯列表
欧洲“DeepSeek”发布了全世界最好的 OCR,网友:蹲蹲中国的免费开源版
就在刚刚,那个曾经开源了首个 MoE 模型的欧洲初创公司 Mistral AI 在沉寂一段时间之后又出新活。 Mistral 团队发布了一个号称“全世界最好的 OCR”的产品 —— Mistral OCR,旨在将一些 AI 难以直接识别的粗糙且复杂的文件进行整理,便于 AI 操作识别。 帖子一经发出,评论区瞬间充满了各种夸夸言论,但在一众赞美声中,也不乏一些真正用过产品的网友的理智发言。
3/14/2025 4:25:00 PM
郑佳美
消息称汽车智驾企业“小马智行”及“文远知行”拟赴港二次上市,双方回应均“否认”
近日有消息称小马智行及文远知行正筹备港股上市,但两家公司均予以否认。小马智行已于2024年11月27日在美国纳斯达克上市,文远知行则于2024年10月25日上市。截至3月13日,两家公司市值相近,约44.70亿美元。#小马智行# #文远知行#
3/14/2025 4:17:21 PM
漾仔
号称行业首家:荣耀文档接入 DeepSeek 模型满血版,MagicOS 9.0 设备可用
荣耀MagicOS的荣耀文档应用现已正式接入DeepSeek模型满血版,在搜索问答、文本创作等方面与DeepSeek深度结合,提供更智能的一站式文档AI创作体验。
3/14/2025 4:11:17 PM
清源
小米 AI 搜索 / 写作等在列,北京市新公布 34 款已完成登记的生成式人工智能服务
北京市新公布34款已完成登记的生成式人工智能服务,小米AI搜索、AI写作等产品在列。截至目前,北京累计已完成46款生成式AI服务登记。小米此前在澎湃OS发布会上已展示多项AI功能。#小米AI# #生成式AI#
3/14/2025 4:09:45 PM
漾仔
挑战传统:无归一化层的 Transformer 架构新突破
在深度学习领域,归一化层被视为现代神经网络中不可或缺的组件之一。 最近,一项由 Meta FAIR 研究科学家刘壮主导的研究成果 ——“没有归一化层的 Transformer” 引发了广泛关注。 这项研究不仅提出了一种名为动态 tanh(Dynamic Tanh,DyT)的新技术,还展示了在不使用传统归一化层的情况下,Transformer 架构依然可以实现高效的训练和推理。
3/14/2025 4:06:00 PM
AI在线
摩根大通软件工程师用上“编程助手”,效率最高提升 20%
据路透社今日报道,摩根大通全球首席信息官洛里·比尔表示,该行自主开发的一款编程助手工具已帮助数万名软件工程师提升效率,使产品交付速度加快10%至20%。
3/14/2025 3:57:45 PM
清源
没有归一化层的Transformer!刘壮带队,何恺明、Yann LeCun都参与了
何恺明又双叒叕发新作了,这次还是与图灵奖得主 Yann LeCun 合作。 这项研究的主题是没有归一化层的 Transformer(Transformers without Normalization),并已被 CVPR 2025 会议接收。 Meta FAIR 研究科学家刘壮的推文过去十年,归一化层已经巩固了其作为现代神经网络最基本组件之一的地位。
3/14/2025 3:54:00 PM
机器之心
人类秒懂,AI却懵圈:VLM²-Bench揭示视觉语言模型「视觉关联」能力短板
本文来自港科与 MIT 教授团队。 本文有两个共同一作:张鉴殊为武汉大学本科四年级,本篇为其在港科大访问期间完成,将于 2025 秋季前往美国西北大学攻读 CS PhD。 姚栋宇目前就读于 CMU CS 系下的 MSCV 项目。
3/14/2025 3:48:00 PM
机器之心
全球首个化学反应AI「考场」,7种MLIPs模型与SOTA生成式模型同场PK
编辑 | ScienceAI过渡态(Transition State, TS)是化学反应的「关键帧」,就像群山中的最低隘口,决定了分子翻山越岭所需的能量和路径。 然而,TS 的寿命仅有飞秒级(10⁻¹⁵ 秒),实验观测如同捕捉闪电一瞬——目前只能依赖量子化学计算来寻找。 传统的密度泛函理论(DFT)虽能提供高精度结果,但单次 TS 搜索可能消耗数十至数千 CPU 时,面对成百上千反应节点的复杂网络,计算成本高得难以承受。
3/14/2025 3:22:00 PM
ScienceAI
阿里通义实验室语音团队负责人鄢志杰离职
据tech星球消息,阿里通义实验室语音团队负责人鄢志杰已于 2 月 15 日正式离职,其职级为阿里原P序列体系中的P10 级别。 鄢志杰是智能语音领域专家, 2003 年进入中科大语音实验室攻读博士,师从科大讯飞创始人王仁华教授。 2008 年获博士学位后,他在微软亚洲研究院语音组担任主管研究员至 2015 年,主要研究语音识别、语音合成等领域。
3/14/2025 3:00:41 PM
AI在线
Android Studio集成Gemini新增多模态功能,开发者可上传图像获取UI代码
谷歌最新宣布,Android Studio中的Gemini助手已升级支持多模态输入功能,开发者现在可以直接将图像附加到提示中,以获取应用程序开发过程中的视觉辅助。 这项多模态功能最初在I/O2024大会上亮相,升级后的Gemini现能够"理解简单的线框,并将其转换为可用的Jetpack Compose代码"。 在Android Studio Narwal的Canary版本中,Ask Gemini字段新增了"附加图像文件"(支持JPEG或PNG格式)选项。
3/14/2025 2:45:00 PM
AI在线
北京新增34款已完成登记的生成式AI服务,小米AI搜索、Monica在列
网信北京发布了最新北京市生成式人工智能服务已登记信息公告,公称,根据《生成式人工智能服务管理暂行办法》及有关规定,对于通过API接口或其他方式直接调用已备案大模型能力的生成式人工智能应用或功能,采用登记管理方式,允许上线提供服务。 截至3月14日,我市新增34款已完成登记的生成式人工智能服务,累计已完成46款生成式人工智能服务登记。 其中,小米AI搜索、小米AI写作、Monica等产品在列。
3/14/2025 2:20:00 PM
AI在线
论文阅读噩梦终结!AI神器横空出世: arXiv论文一键变博客,科研效率火箭式飙升!
你是否还在论文的海洋里苦苦挣扎?面对学术网站 arXiv 上堆积如山的论文,是不是也感到头皮发麻,无从下手? 那些晦涩难懂的术语,曲折冗长的段落,复杂烧脑的图表,简直像一道道 impenetrable 的高墙,将求知的心牢牢阻隔在外。 对于科研爱好者、莘莘学子,甚至是专业人士来说,啃下一篇论文,往往需要耗费数小时的精力,甚至要查阅海量资料才能勉强摸到门道,这效率,简直让人抓狂!但!是!
3/14/2025 1:54:00 PM
AI在线
技术霸权的真面目:OpenAI游说白宫“放水”,转身对中国AI放火
当全球目光聚焦于人工智能技术竞赛时,OpenAI的“双面游戏”正露出狰狞面目:一边高举“创新自由”大旗游说美国政府放松监管,一边却对中国AI新秀DeepSeek发动围剿。 这种“只许我放火,不许你点灯”的霸权逻辑,撕开了硅谷科技巨头“技术无国界”的虚伪面纱。 “自由创新”是假,垄断利益是真特朗普废除拜登时期AI监管框架后,OpenAI火速向白宫递交“政策建议”,核心诉求直指“宽松监管”和“加速创新”,甚至鼓吹用“自愿合作”取代法律约束,要求美国制定“促进学习自由”的版权政策,将数据掠夺包装成“合理使用”。
3/14/2025 1:17:02 PM
超越ChatGPT:通向AGI的五个最严峻挑战
但像我们这样看着《星际迷航》、《银翼杀手》或《2001太空漫游》长大的人知道,这只是个开始。 与那些虚构世界中的AI,甚至是人类自己相比,今天的AI无法完全探索、交互并从这个世界中学习。 如果它可以做到,就像《星际迷航》中那个非常有用的机器人Data(或一个人类)一样,它可以学会如何解决任何问题或执行任何工作,而不仅仅局限于它最初被训练来做的事情。
3/14/2025 1:12:53 PM
Bernard Marr
谷歌大招网友玩疯了!Gemini原生图像输出抢先推出,OpenAI一年领先优势归零
谷歌推出Gemini原生图像生成,测试版瞬间引爆网络。 如果你迟到了,但没有好的借口,甚至还没有出家门——只需要一张自拍,然后让AI把你P到地铁故障现场。 图片也可以凭空生成一个人物形象,把它放到原神游戏画面中(不用上传游戏截图),让角色往前走两步,再把视角往左移,走近一个建筑,开始爬墙。
3/14/2025 12:14:38 PM
ChatGPT再进化:o1支持调用Python分析数据,网友:已经成为Copilot了
今天一大早,ChatGPT突然更新——基于Python的数据分析功能,在o1和o3-mini当中也可以使用了。 OpenAI介绍,现在可以通过两款模型调用Python,完成数据分析、可视化、基于场景的模拟等任务。 量子位实测发现,虽然界面并无明显变化,但是Python的确已经在o1当中悄悄“上岗”了。
3/14/2025 12:14:24 PM
量子位
FP8模型不再挑卡!DeepSeek推理成本减半速度翻番,清华团队开源「赤兔」推理引擎
随着 DeepSeek 引燃市场对于大模型私有化部署的热情,模型部署的效率与成本成为企业 AI 落地的关键瓶颈。 今天,清华系科创企业清程极智与清华大学翟季冬教授团队联合宣布开源大模型推理引擎「赤兔」(Chitu),率先实现了非 H 卡设备(英伟达 Hopper 架构之前的 GPU 卡及各类国产卡)运行原生 FP8 模型的突破。 在 A800 集群上的实测数据显示,用赤兔引擎部署 DeepSeek-671B 满血版推理服务,相比于 vLLM 部署方案,不仅使用的 GPU 数量减少了 50%,而且输出速度还提升了 3.15 倍。
3/14/2025 12:06:00 PM
机器之心