理论
直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型
32B推理模型,仅用1/8数据,与同尺寸DeepSeek-R1打成平手! 就在刚刚,来自斯坦福、UC伯克利、华盛顿大学等机构联手发布了一款SOTA级推理模型——OpenThinker-32B,并同时开源了高达114k的训练数据。 项目主页: Face:::采用经DeepSeek-R1验证标注(基于R1蒸馏)的大规模优质数据集,便可训练出SOTA的推理模型。
2/14/2025 9:20:00 AM
新智元
DeepSeek很火,我来泼点冷水
从24年12月DeepSeek出圈以来,DeepSeek风潮越刮越勇,已有席卷全球之势。 各个大厂纷纷宣布自家接入DeepSeek,甚至有机顶盒企业也宣布自家产品接入了,市场情绪一度高涨。 在自媒体上,以DeepSeek为噱头卖课的,教人如何使用DeepSeek提示词的,或者利用DeepSeek 其他AI工具做自媒体赚快钱的,各种案例不胜枚举。
2/14/2025 9:17:16 AM
写文章的老张
打破纪录!谷歌全网扒1000亿图像文本对,ViT大佬坐镇:数据Scaling潜力依旧
史上最大规模视觉语言数据集:1000亿图像-文本对! 较此前纪录扩大10倍。 这就是由谷歌推出的最新数据集WebLI-100B。
2/14/2025 9:17:00 AM
量子位
Meta全新脑机接口模型,挑战Neuralink!无需植入芯片实现「心灵感应」
脑机接口一直是全球关注的新技术。 尤其是有着马斯克光环加持下的Neuralink,更是备受瞩目。 几天前,Neuralink发文称,过去一年中已经有三名瘫痪患者接受了Neuralink的植入。
2/14/2025 9:15:00 AM
新智元
文心一言全面免费了,深度搜索功能同时上线,第一手实测在此
一天内,OpenAI、百度两家AI大厂同时打出免费牌! 几天前被爆出文心5.0消息后,今天百度突然宣布:文心一言将于4月1日零时起,全面免费! 所有PC端和APP端用户均可体验文心系列最新模型。
2/14/2025 9:12:00 AM
量子位
超详细,DeepSeep 接入PyCharm实现AI编程!(支持本地部署DeepSeek及官方DeepSeek接入),建议收藏!
在当今数字化时代,AI编程助手已成为提升开发效率的利器。 DeepSeek作为一款强大的AI模型,凭借其出色的性能和开源免费的优势,成为许多开发者的首选。 今天,就让我们一起探索如何将DeepSeek接入PyCharm,实现高效、智能的AI编程。
2/14/2025 9:10:47 AM
狂师
比尔盖茨自述曾是熊孩子:16岁徒步数百英里,边走脑中边写BASIC代码
步入70岁之际,比尔·盖茨终于出版了自己人生中的首部自传《源代码》。 不同于以往的商业发展视角,无关对微软成就的宏大叙事,在这本书里,比尔·盖茨自己的成长历程和创业故事一一铺陈开:生在一个优秀的家庭,撞上历史性技术变革与乐观情绪弥漫的时代,自己在个人电脑革命方兴未艾之时步入成年……过去十几年,比尔·盖茨一直站在技术发展的潮头浪尖,他关于科技、计算机、AI的每一次预测和思考都引人注目。 今年1月13日,他在阿联酋的阿布扎比CNN学院,分享了自己关于AI基数的最新洞见。
2/14/2025 9:05:00 AM
量子位
Diffusion-SS3D:用扩散去噪革新半监督3D检测,伪标签更准,mAP提升6%!
一眼概览SemCity 是一种 基于三平面扩散(Triplane Diffusion) 的 3D 语义场景生成模型,能够在 真实户外环境 中进行 场景生成、语义补全、场景扩展(Outpainting)和修补(Inpainting),并在 SemanticKITTI 数据集 上显著提升生成质量。 核心问题背景问题:当前 3D 扩散模型大多专注于 单个物体 或 室内合成场景,对于 真实户外场景 仍然缺乏研究。 此外,户外数据由于传感器局限性(空白区域较多),导致模型难以学习 完整的三维语义分布。
2/14/2025 9:02:19 AM
萍哥学AI
仅需3步,稳定快速!火山引擎边缘大模型网关全面支持DeepSeek系列模型
DeepSeek 作为大模型新锐,凭借其在算法、架构及系统等核心领域的创新突破,迅速获得业界瞩目。 在巨大的热度下,面对海量请求,越来越多用户遇到了请求失败、调用超时、结果无法返回等稳定性问题。 火山引擎边缘大模型网关通过一个 API 接入多家模型服务,利用全球边缘节点就近调用,提升响应速度;支持故障自动切换、重试和超时控制,确保服务可靠性;兼容 OpenAI 接口标准,可快速集成 DeepSeek 等模型,降低接入成本。
2/14/2025 9:00:00 AM
边缘云技术团队
提示工程(prompt engineering)大揭秘
前言今天分享的是提示工程(prompt engineering),我们大概可以将其理解为用简单明了的话告诉AI你需要什么,比如先讲清任务,再加例子或背景,这样AI才能更懂你,给出更准更有用的回答! 2025年注定不平凡,大模型百花争放,闭源的守着自己的一亩三分地不断深耕,开源的出来就是王炸,开源大模型以DeepSeek为首的尤其突出,随后OpenAI,百度文心一言等相继传出部分大模型免费开放给用户使用。 普通老百姓现在能做的就是学会如何同人工智能交流,并得到你要的结果。
2/14/2025 8:44:39 AM
独行者木子李
本想去谷歌捞一笔就跑,却成了改变AI历史的人|Transformer作者对话Jeff Dean
谷歌两位大佬回应一切:从PageRank到AGI的25年。 现任首席科学家Jeff Dean、出走又回归的Transformer作者Noam Shazeer,与知名播客主持人Dwarkesh Patel展开对谈。 视频刚发几个小时,就有20万 网友在线围观。
2/14/2025 8:40:00 AM
量子位
o3斩获IOI金牌冲榜全球TOP 18,自学碾压顶尖程序员!48页技术报告公布
几天前,谷歌AlphaGeometry 2拿下IMO金牌,震惊了所有人。 这次,o3在IOI 2024竞赛中取得惊人的394分(满分600),一举夺得金牌,实力相当于全球第18名赛级选手。 不仅如此,在世界级编程竞赛CodeForces上,o3位居全球Top 200之列,堪比人类顶尖程序员。
2/14/2025 8:30:00 AM
新智元
八款支持 C# 语言的 AI 辅助编程神器,高效编程利器!
前言在当今这个AI技术日新月异的时代,一股创新的浪潮正席卷着软件开发领域,其中AI辅助编程工具以其独特的魅力脱颖而出,成为了众多开发者不可或缺的得力助手。 这些工具不仅能够显著提升开发效率,优化代码质量,还能有效降低bug产生率,是现代软件开发过程中不可或缺的重要助手。 今天大姚给大家分享8款实用、高效且免费的AI辅助编程工具(并且都支持C#语言),希望对大家有所帮助。
2/14/2025 8:13:05 AM
大姚
本地轻松使用Gemini 2.0 Pro
译者 | 布加迪审校 | 重楼谷歌加大了角逐人工智能领域的筹码,发布了最新的实验模型。 继DeepSeek和OpenAI之后,谷歌宣布推出Gemini 2.0 Flash以及两个新的实验模型:Gemini 2.0 Pro和Gemini 2.0 Flash-Lite。 据谷歌DeepMind团队声称,Gemini 2.0 Pro是其迄今为止最先进的模型,在编程性能和处理复杂提示方面表现出色。
2/14/2025 8:00:00 AM
布加迪
神了!最大化 DeepSeek 潜能 :知识图谱激活
deepseek原理 应用 实践,和大家分享:小众的,deepseek核心技术原理;大众的,提示词要怎么写;画外音:文末有大彩蛋。 今天和大家聊聊,deepseek的核心技术之一的知识图谱激活。 什么是知识图谱(Knowledge Graph)?
2/14/2025 8:00:00 AM
58沈剑
向DeepSeek学习深度思考-十大思维链模式和案例分析
在这个复杂性与不确定性交织的时代,我们每天都在面对职场决策、生活管理、技术变革等诸多问题的挑战。 当常规的直觉反应和零散的思考难以应对精密问题时,结构化思维链就像一柄思维解剖刀——它帮助我们在乱麻中梳理出清晰的脉络,在混沌中发现隐藏的逻辑路径。 在我上一篇文章已经谈到,学习DeepSeek深度思考中CoT思维链的内容往往比最终的问题答案更加重要。
2/14/2025 5:00:00 AM
何明璐
一文带你看懂开源大模型基石LLaMA核心技术点,DeepSeek/千问等LLM的模型结构基础
LLaMA是目前很多SOTA开源大模型的基础,包括DeepSeek、千问等在内的很多大模型的模型机构大体上都沿用了LLaMA。 因此,LLaMA在模型结构的设计上可以说是目前大模型的一种最佳实践。 这篇文章就给大家汇总一下LLaMA的核心模型结构。
2/14/2025 1:00:00 AM
Fareise
十分钟手把手教学:用DeepSeek4j开发私有大模型知识库
背景deepseek4j 提供了一套强大的 API,涵盖了 Reasoner、Function Calling、JSON 解析等特性。 本工具旨在简化 DeepSeek API 的集成,让开发者能够快速调用相关能力并集成到自己的应用中。 然而,DeepSeek 官方并未提供向量模型,因此本工具在最初设计时未考虑向量搜索的集成。
2/14/2025 1:00:00 AM
冷冷
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
Anthropic
腾讯
研究
神经网络
3D
计算
生成
Sora
机器学习
AI设计
AI for Science
苹果
GPU
训练
AI视频
华为
搜索
Claude
场景
人形机器人
百度
智能体
xAI
预测
伟达
大语言模型
深度学习
Transformer
字节跳动
模态
LLaMA
文本
具身智能
神器推荐
Copilot
视觉
驾驶
API
应用
Agent
算力
大型语言模型
工具
安全
干货合集
视频生成