资讯列表
AI芯片公司Cerebras与Mistral合作,声称创速度纪录超DeepSeek
人工智能芯片公司 Cerebras Systems 于本周四宣布与法国开源 AI 技术公司 Mistral 达成合作,并帮助后者创造了新的速度记录。 Mistral 旨在与 Meta 和中国的 DeepSeek 等开源竞争对手抗衡,这些公司在上个月凭借低成本和卓越性能的技术震动了全球市场。 这三家公司都在与 ChatGPT 的开发者 OpenAI 展开竞争。
2/7/2025 4:15:00 PM
AI在线
EvalPlanner:基于“计划-执行”双阶段的大语言模型评估框架
大语言模型(LLM)评估系统在生成思维链(Chain-of-Thought, CoT)序列时,需要系统地捕捉评估过程中的推理步骤。 但是由于缺乏人工标注的CoT训练数据,以及预定义评估提示在复杂任务中的局限性,构建高质量的LLM评估模型面临重大挑战。 另外手动调整评估指令的方法在面对多样化和复杂任务时表现出明显的局限性。
2/7/2025 4:07:39 PM
SACHIN KUMAR
AI时代的数据安全革命:企业智能转型的洁净数据法则
在采访中,Pangea的CEO Oliver Friedrichs深入剖析了企业AI化进程中数据卫生管理的关键作用。 随着AI应用处理敏感数据规模呈指数级增长,陈旧的访问控制体系与过时的安全策略正衍生出前所未有的风险。 问:数据卫生实践如何与整体网络安全战略协同?企业在整合内部数据与大语言模型(LLM)时,正面临全新的数据隐私挑战。
2/7/2025 3:55:25 PM
Mirko Zorz
AI成本革命:DeepSeek-R1与OpenAI的颠覆性突破重构企业智能新范式
AI领域的发展日新月异,如果你跟不上步伐,就会落后。 近期的两项进展正在重塑开发者和企业的格局:DeepSeek发布R1模型,以及OpenAI推出新的DeepResearch产品,它们共同重新定义了强大推理模型的成本和可及性,这一点已被广泛报道,然而,较少被讨论的是,它们将如何推动公司采用蒸馏、有监督微调(SFT)、强化学习(RL)和检索增强生成(RAG)等技术,来构建更智能、更专业的AI应用。 在DeepSeek惊人成就的初步兴奋感逐渐平息后,开发者和企业决策者需要考虑这对他们意味着什么。
2/7/2025 3:52:20 PM
Matt Marshall
DeepSeek被禁!最高判刑20年,外交部回应!
过去几周,中国人工智能公司DeepSeek的崛起,在全球范围内引发了一场前所未有的争议。 这款凭借“低成本、高性能”迅速抢占市场的AI工具,不仅一度超越ChatGPT登顶美国应用下载榜,还导致多国科技股震荡下跌。 然而,其“高光时刻”很快被多国的禁令与限制措施打破——美国、意大利、澳大利亚、印度、韩国、日本等国相继以“国家安全”“数据隐私风险”为由,禁止或限制DeepSeek在政府及企业中的使用。
2/7/2025 3:46:17 PM
不才陈某
突破“数据再生产陷阱”:从“语言游戏”迈向超人智能
人类文明的演进始终离不开对信息流通方式的改造:从印刷术到电报,再到互联网,每一次交互门槛的下降都可能催生出新的社会与技术浪潮。 在当前的人工智能(AI)领域,这种“门槛降低”也正在发生:近期,开源大语言模型 DeepSeek R1 借助强化学习技术,在多个关键指标上接近了商用顶尖模型 OpenAI O1,引发行业热议。 为什么这一进展值得关注?
2/7/2025 3:46:00 PM
新闻助手
你的提示词根本只是在浪费算力,让deepseek达到最佳效果的三大原则
最近几周自学deepseek原理 应用 实践,一些成果,和大家分享。 与deepseek这类AI对话,为了达到最佳效果,提示词应当遵循哪三大原则? 清晰性;结构化;细节化;为什么?
2/7/2025 3:11:41 PM
58沈剑
被DeepSeek带火的知识蒸馏,开山之作曾被NeurIPS拒收,Hinton坐镇都没用
DeepSeek带火知识蒸馏,原作者现身爆料:原来一开始就不受待见。 称得上是“蒸馏圣经”、由Hinton、Oriol Vinyals、Jeff Dean三位大佬合写的《Distilling the Knowledge in a Neural Network》,当年被NeurIPS 2014拒收。 如何评价这篇论文的含金量?
2/7/2025 3:10:00 PM
量子位
行业首款 DeepSeek 量产车型落地,消息称岚图知音、梦想家已深度融合 R1 大模型
岚图知音车机云端还将持续融合和蒸馏DeepSeek R1模型。基于对DeepSeek做模型蒸馏,岚图一方面可以优化车机的智能化体验,做到技术的快速迭代;同时还可以降低智能座舱的开发和使用成本。
2/7/2025 3:07:11 PM
清源
法院判决武汉首例 AI 图片创作者维权案,认可创作者享有著作权
法院判决武汉某科技有限公司赔偿王某经济损失及合理开支 4000 元。一审判决作出后,双方均未上诉,判决已发生法律效力,被告已主动履行义务。
2/7/2025 3:00:20 PM
清源
自定义训练的 YOLOv8 模型进行邮票整理
还记得人们过去常常寄信和明信片的日子吗? 明信片上通常描绘了你所访问的城市或国家的一些风景如画的景色,但对许多人来说,邮票才是主要的吸引力。 它们被视为微型艺术品,被认为是非常值得收藏的。
2/7/2025 2:52:11 PM
二旺
Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
继近日斯坦福李飞飞、Percy Liang 等人推出 S1 后,李飞飞的学生、OpenAI 早期成员与前特斯拉 AI 总监也录制了一期最新长达 3 小时的长视频上传到 YouTube,深入浅出地从神经网络的起源、GPT-2、ChatGPT 到最近 DeepSeek-R1 介绍了 AI 大模型的系列进化:视频链接:,视频讲解十分通俗易懂,即使没有技术背景的观众也能轻松理解! 尤其是在视频的第 2 个小时开始,他对最近爆火的 DeepSeek-R1 论文进行了深入介绍,并直言 DeepSeek R1 在性能方面与 OpenAI 的模型不相上下,它的出现推动了 RL 技术的发展。 除了盛赞 DeepSeek-R1 的技术创新外,Andrej Karpathy 还对纯 RL 的学习能力给予了高度评价,但又指出 RL 非常非常擅长发现一种方法来“欺骗”模型,阻碍了 RLHF 成为专业技术的步伐。
2/7/2025 2:50:00 PM
郑佳美
Meta 深陷盗版泥潭,邮件曝光 81.7 TB AI 训练数据黑幕
科技媒体 Ars Technica 今天(2 月 7 日)发布博文,报道称 Meta 公司再次因其 AI 模型训练数据来源,而陷入法律纠纷。
2/7/2025 2:47:19 PM
故渊
OpenAI更新o3-mini模型,展示了给出答案的 “思维链”
近日,OpenAI 在推出其旗舰 AI 模型 o3和 o3-mini 后,进行了重大更新,改变了 o3-mini 的回应方式。 现在,这款模型不仅能够回答用户的问题,还能展示其思考过程,为用户提供更多透明度。 这一变化标志着 OpenAI 在提升用户体验方面迈出了重要一步,使得 AI 工具的使用变得更加人性化。
2/7/2025 2:40:00 PM
AI在线
谷歌 Magic Editor 集成 SynthID,“火眼金睛”识别 AI 造假
AI 生成媒体技术日新月异,其生成的内容
以假乱真。谷歌公司正积极探索解决方案,将 SynthID 水印技术应用于其图像编辑工具 Magic Editor,以识别 AI 生成的图像和视频,从而应对潜在的虚假信息传播风险。
2/7/2025 2:38:02 PM
故渊
《麻省理工科技评论》点评中国AI“四剑客”,每家都媲美DeepSeek
春节期间,DeepSeek 一跃成为全球瞩目的焦点。 它以仅约十分之一的超低训练成本,成功推出了性能与OpenAI o1近乎相当的开源模型,对全球科技领域带来巨大冲击,先后引发美国科技股的大幅下跌,以及硅谷科技巨头和各国政要的纷纷回应,如今全球各大芯片厂商和智算云服务厂商更是积极响应、跟进适配。 半个月来,DeepSeek相关话题热度居高不下,热搜频频,已成为全球科技、经济乃至政治领域的重要话题。
2/7/2025 2:37:00 PM
新闻助手
斥 300 亿-500 亿美元巨资,法国、阿联酋将共建 AI 专用数据中心
法阿联合声明称,两国领导人希望在人工智能领域建立战略伙伴关系,并将共同推进相关项目和投资,以促进人工智能产业链的发展。
2/7/2025 2:18:43 PM
清源
从 DeepSeek 火热,到李飞飞团队新成果,“幕后高手”竟是它
最近 AI 大模型领域可以说是热点话题不断,DeepSeek 的热潮还未消退,国内李飞飞团队提出的一种模型训练新方法又在行业里引发热议
2/7/2025 2:13:55 PM
汐元