AI在线 AI在线

资讯列表

巨资加码!欧盟祭出2000亿欧元AI发展计划,全面布局超算与AI制造

在全球AI竞争日益激烈的背景下,欧盟正式宣布了一项力度空前的人工智能投资计划。 今天在巴黎AI行动峰会上,欧盟委员会主席冯德莱恩正式发布了名为"Invest AI"的宏伟计划,展现出欧盟在全球AI竞争中的坚定决心。 这项总规模达2000亿欧元的投资计划中,最引人注目的是专门设立了200亿欧元的欧洲基金,用于建设AI巨型工厂。
2/12/2025 2:46:00 PM
AI在线

Anthropic CEO警告:AI将在 2026 年前达到 “天才国家” 水平

在最近于巴黎举行的人工智能行动峰会上,Anthropic 公司的首席执行官达里奥・阿莫代伊(Dario Amodei)发表了引人关注的讲话。 他警告称,人工智能将在2026年或2027年达到相当于 “一个天才国家” 的智能水平。 这一预测成为了业界对未来技术发展的最明确的预言之一。
2/12/2025 2:29:00 PM
AI在线

超越思维链?深度循环隐式推理引爆AI圈,LLM扩展有了新维度

不需要特殊训练数据,能处理语言难以形容的任务,3.5B 参数能实现 50B 的性能。 这是一种全新的语言模型架构,能够通过使用循环语言模型在潜在空间中隐式推理,显著提升模型的计算效率,尤其是在需要复杂推理的任务上。 近日,马里兰大学的一篇论文在 AI 研究社区中引发了关注,其提出的语言模型通过迭代循环块来工作,能在测试时展开到任意深度。
2/12/2025 2:22:00 PM
机器之心

掌阅科技推动人工智能大模型在数字阅读领域的应用

掌阅科技近日在互动平台上表示,正在积极推进人工智能大模型在数字阅读的垂直领域应用。 随着技术的不断进步,掌阅科技充分利用其在内容版权、创作者生态和庞大用户基础方面的优势,力求将国内领先的人工智能大模型与公司的业务场景进行深度融合。  掌阅科技的目标是通过引入和应用多个大模型,如 DeepSeek、豆包及其他相关技术,来提升业务效率和用户体验。
2/12/2025 2:14:00 PM
AI在线

马蜂窝携手DeepSeek 大模型,提升贵州旅游智能化服务

近日,旅游行业的重要参与者马蜂窝宣布其自主研发的 AI 智能应用已正式接入 DeepSeek 大模型。 这一举措标志着马蜂窝在提升旅游服务智能化水平方面迈出了重要一步,尤其是在贵州这一旅游资源丰富的省份。 根据马蜂窝的规划,此次接入的首个阶段将优先应用于已经上线的 “AI 游贵州”、“AI 游黔西南” 和 “AI 游西江” 项目。
2/12/2025 2:10:00 PM
AI在线

如何利用 DeepSeek-R1 本地部署强大的推理模型:从 ChatGPT 风格界面到 API 集成

01、概述随着开源推理模型如 DeepSeek-R1 的崛起,开发者可以在本地运行强大的 AI,而不再依赖于云服务。 这一技术的出现引发了不小的网络热议,或许你也在好奇如何利用这一模型在本地搭建自己的 AI 系统。 本指南将带你了解两种关键的使用场景:普通用户:创建一个 ChatGPT 风格的界面开发者:通过 API 集成模型到应用中在开始之前,如果你有兴趣深入了解 DeepSeek-R1 的背景,以便更好地理解接下来的过程,可以参考我的文章《DeepSeek-R1 理论简介(适合初学者)》。
2/12/2025 2:09:31 PM
基咯咯

字节跳动豆包UltraMem架构将大模型推理成本降低83%

字节跳动豆包大模型团队今日宣布,成功研发出全新稀疏模型架构UltraMem,该架构有效解决了MoE(混合专家)模型推理时的高额访存问题,推理速度较MoE提升2-6倍,推理成本最高可降低83%。 这一突破性进展为大模型的高效推理开辟了新路径。 UltraMem架构在保证模型效果的前提下,成功解决了MoE架构推理时的访存瓶颈。
2/12/2025 2:04:00 PM
AI在线

报道称百度今年将发布下一代人工智能模型Ernie 5.0

据媒体报道,百度今年将推出下一代人工智能模型 Ernie5.0。 消息人士称,被称为“基础模型”的Ernie5.0,将在多模态能力方面有重大增强,但没有具体说明其功能。 这一消息正值苹果公司将其潜在客户转向阿里巴巴之后,市场普遍猜测此举是百度为了应对局势的变化,试图稳住股价和市场地位。
2/12/2025 2:00:30 PM
AI在线

AMD开源科研AI Agent,一站式自动写论文

科学研究的漫长历程中,受限于时间和资源,许多高质量的研究想法未能得到充分探索。 如果能够减少探索想法的限制,研究人员将能够同时研究多个概念,增加科学发现的效率。 所以,为了帮助科研人员节省时间快速撰写论文,AMD和约翰·霍普金斯大学的研究人员联合开源了一个专用于科研的AI Agent——Agent Laboratory。
2/12/2025 1:44:12 PM
AIGC开放社区

DeepSeek并非完美,训练过程存在“深度诅咒”

高性能大模型在训练的过程中通常需要数千个GPU,耗费数月甚至更长时间才能完成一次训练。 这种巨大的资源投入使得模型的每一层都必须高效训练,才能确保算力资源最大化利用。 但大连理工、西湖大学、牛津大学等研究人员对DeepSeek、Qwen、Llama和Mistral研究发现,这些模型的深层在训练过程中表现并不好,甚至可以被完全剪枝而不会影响模型性能。
2/12/2025 1:42:25 PM
AIGC开放社区

AI太强,验证码全失效?新南威尔士全新设计:GPT傻傻认不出,人类一致好评

验证码通过利用人类与机器的认知差异实现身份验证。 传统的验证码方案主要依赖文本扭曲[1]、图像分类[2,3]或逻辑推理[4]来区分人类与机器,但随着多模态LLMs(Large Language Model)的发展[5],这些方法逐渐失效,机器也能达到人类水平的认知。 GPT-4o对简单「文本验证码」的破解成功率超过90%,Gemini 1.5 Pro 2.0[6]能识别带噪声的「reCAPTCHA图像」(成功率50%);LLMs在「推理验证码」上的表现较差(平均成功率20%),但人类用户的失败率也同样很高。
2/12/2025 1:37:56 PM
新智元

如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践

本文的通讯作者是北京大学计算机学院长聘教授李戈。 本文一作是 aiXcoder 蒋思源和北大李戈教授课题组博士生李佳,团队重点关注融合深度学习与软件工程的代码建模方法。 如何训练一个代码大模型?
2/12/2025 1:34:40 PM
机器之心

统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA

在最近的一篇论文中,来自字节跳动、北京大学等机构的研究者提出了 Sa2VA。 市面上第一个结合 SAM-2 和 LLaVA-like 的视频多模态大模型,结合了 SAM-2 和 LLaVA 的优势,实现了时空细粒度的理解。 论文地址:: 地址:,研究者设计了一套统一的指令微调格式 (Instruction Tuning Pipeline),整合了五种不同的任务,超过 20 个数据集一起进行联合训练。
2/12/2025 1:31:33 PM
机器之心

海信电视接入 DeepSeek,支持 AI 语音对话

接入 DeepSeek 后,海信电视用户无需复杂的操作步骤,使用海信电视遥控器小聚 AI 键或者直接通过语音打开 DeepSeek,在对应的智能体对话页面内,用户通过语音对话即可体验。
2/12/2025 1:25:57 PM
汪淼

淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1

当看到这条消息时,机器之心编辑部陷入了集体沉默。 作为一个免费开源的模型,DeepSeek 竟能让倒卖商如此大赚特赚,也着实让人震惊。 而这也从侧面佐证了 DeepSeek 模型引发的本地部署热潮是多么汹涌。
2/12/2025 1:23:47 PM
机器之心

奥特曼公开回怼马斯克,OpenAI董事会成员:说要收购,没收到报价啊?

奥特曼马斯克互怼继续! 继两人因“收购OpenAI”在𝕏平台爆发口水大战后,OpenAI CEO奥特曼在随后的巴黎AI峰会上,对马斯克予以公开回击。 马斯克此举只是压制竞争的小伎俩,我希望他能通过打造更好的产品来竞争;可能他的一生都处于不安全状态,我为这个人感到难过…我不认为他是个快乐的人。
2/12/2025 1:17:25 PM
量子位

DeepSeek 被曝估值最高 1500 亿美元达 OpenAI 一半,巴黎地铁 70 岁老人都在聊

最近,外媒 Bloomberg 曝出了惊人消息:DeepSeek 的估值竟已飙至 1500 亿美元,已经达到 OpenAI 的一半?在巴黎 AI 峰会现场,DeepSeek 已经如同房间里的大象。甚至巴黎地铁里的 70 岁老人也开始讨论 DeepSeek!
2/12/2025 1:06:26 PM
汪淼

豆包提出全新稀疏模型架构 UltraMem,推理成本较 MoE 最高可降 83%

实验结果表明,训练规模达 2000 万 value 的 UltraMem 模型,在同等计算资源下,可同时实现业界领先的推理速度和模型性能,为构建数十亿规模 value 或 expert 开辟了新路径。
2/12/2025 12:58:01 PM
清源