理论
DeepSeek 火爆了,主打高性能低价格!
大家好,我是君哥。 春节这几天,DeepSeek 可以说是火爆了,铺天盖地都是 DeepSeek 的报道。 今天,我们一起学习一下 DeepSeek。
硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
顶级“礼遇”。 一觉醒来,OpenAI和Claude母公司都对DeepSeek出手了。 据《金融时报》消息,OpenAI表示已经发现证据,证明DeepSeek利用他们的模型进行训练,这涉嫌侵犯知识产权。
全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
万字长文解读Scaling Law的一切,洞见LLM的未来
Scaling Law 撞墙了吗? 这算得上是近段时间 AI 领域最热门的话题之一。 近日,资深机器学习研究科学家 Cameron R.
赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!
编辑丨&人工神经网络(ANN)是大多数深度学习(DL)算法的核心,这些算法可以成功解决图像识别、自动驾驶和自然语言处理等复杂问题。 然而,与能够高效解决类似问题的生物大脑不同,DL 算法需要大量可训练参数,这使得它们能耗高且容易过拟合。 来自希腊研究与技术基金会两位研究员示了一种新的 ANN 架构,它结合了生物树突的结构化连接和受限采样特性,抵消了这些限制。
Nature发布:2025年值得关注的七项技术
编辑 | 20492025 年,全球科技发展正以惊人的速度重塑人类社会的未来。 在气候危机、疾病威胁与资源短缺的多重压力下,技术创新聚焦于两大核心方向:可持续性与人工智能(AI)的深度结合。 《Nature》盘点了今年将密切关注的七项技术,从实验室的自动化革命到城市的生态改造,从精准医疗到环境修复,七项技术不仅加速科学发现,更试图为人类提供应对复杂挑战的规模化方案。
David Baker 利用 AI 设计蛋白质,一招制蛇毒,或将彻底改变蛇咬治疗
编辑丨&蛇中毒是一种严重的个人健康威胁,每年导致约 10 万人死亡和 30 万人永久残疾,尤其是在医疗资源匮乏的地区。 目前的抗蛇毒血清主要依赖于动物血浆提取的多克隆抗体,存在成本高、副作用大、对某些毒素效果有限等问题。 今年诺贝尔化学奖得主 David Baker 团队的一项研究揭示了蛇咬伤治疗可能改变游戏规则。
CityDreamer4D: 下一个世界模型,何必是视频生成模型?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
英伟达市值蒸发近6000亿美元,而DeepSeek刚刚又开源新模型
机器之心报道,编辑:亚鹂、Panda。
验证速度提升25倍,准确率达95.1%,清华团队提出基于物理信息学习的电池衰减预测方法
图 1:研究概念图。 编辑 | ScienceAI随着全球对可再生能源需求的日益增长,电池作为储能系统关键技术的地位愈发凸显。 然而,电池研发过程中面临着从材料原型到商业产品转化的重重挑战,电池原型验证效率低、研发成本高以及生产废料管理不善等问题制约着电池行业的可持续发展。
闲来无事,我测了测国产大模型的RAG能力 新智元 新智元 2025年01月27日 12:25 北京
最近,AI界被推理模型刷屏了。 国内各家的推理模型,在新年到来之际不断刷新我们的认知。 不过,当我们在实际应用中考量大模型,衡量好不好用的标准,就绝不仅仅局限于其性能和规模了。
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理
2025年主导AI的将是第3代scaling law:测试时计算。 正如Michael Dell转述所言:第一代scaling:预训练像读大学第二代scaling:微调像读博士第三代scaling:测试时计算就像深度思考和推理近日,计算机强校CMU机器学习系,发表博客文章解释LLM测试时计算优化问题,特别是涉及到的元强化学习(meta-RL)问题。 文章亮点如下:监督学习只是在训练模型「答案是什么」,只要学习「如何解答」,模型泛化性会更好。
DeepSeek R1,如此火爆!
编辑 | 言征、伊风相信连DeepSeek的创始人梁文锋自己都没有想到,春节前的一次发布,让全球AI圈都陷入了“冰与火”之中,一方面大洋两岸都在惊叹:一家出自浙江的非“六小龙”公司能欧这么短时间就能用开源的方式,推出性能堪比甚至赶超OpenAI o1的模型,成本却更是出奇的低。 一时间,全球AI玩家纷纷快速推出自己的“DeepSeek-R1”复刻版。 抱抱脸、伯克利、港科大很快就用实力证明了:DeepSeek R1 是名副其实的国产推理模型的巨大胜利!
DeepSeek在美超越ChatGPT!问鼎苹果免费App第一
DeepSeek的热,还在持续ing。 就在刚刚过去的周末,DeepSeek反超ChatGPT,一举登顶美区苹果应用商店免费App排行第一! 其热度之高,有网友甚至这样描述:我甚至都不喜欢AI助手应用,但我已经下载了DeepSeek。
人工智能工具帮助科学家预测病毒进化
新冠肺炎凸显了在有效预测和应对新发传染病方面的重大差距。 疫情的毁灭性影响是一个持久的提醒。 虽然我们摆脱了新冠肺炎,其他病毒或新突变仍可能构成威胁。
OpenAI推出Operator帮助用户自动浏览网站
OpenAI发布了一个新的用于预览的AI代理Operator,该代理可以控制计算机浏览器并代表你执行操作。 该工具可以通过键入、单击和滚动与网页进行交互。 Operator是OpenAI的首批AI代理之一。
创造历史!DeepSeek超越ChatGPT登顶中美AppStore
DeepSeek 20 日发布以来获得的热度至今依然没有任何消退的迹象。 一觉醒来,DeepSeek 发布的 iOS 应用甚至超越了 ChatGPT 的官方应用,直接登顶 AppStore。 不少网友都认为这是他们当之无愧。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉