理论
AI创业踩坑!YC合伙人警告:“仅仅在业务中调用OpenAI API,并不会改变创业公司的命运!”,建议创始人来湾区定居
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“创业者们仍然需要做的基本工作,才能让技术为客户创造价值。 如果你不做这些,仅仅把你的想法转向调用OpenAI的东西,并不会改变你作为创业公司的命运。 ”AI赋予了一个人进化成“超级个体”的机会,也让许多“一人公司”等小团队实现高收入神话。
2/3/2025 1:18:01 PM
伊风
多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳
本文一作 Maham Tanveer 是 Simon Fraser University 的在读博士生,主要研究方向为艺术视觉生成和创作,此前在 ICCV 发表过艺术字体的生成工作。 师从 Hao (Richard) Zhang, IEEE Fellow, Distinguished Professor, 并担任 SIGGRAPH 2025 Paper Chair. 本文尾作 Nanxuan (Cherry) Zhao 在 Adobe Research 担任 Research Scientist, 研究方向为多模态可控生成和编辑,有丰富的交叉方向研究经历(图形学 图像 人机交互),致力于开发可以让用户更高效进行设计创作的算法和工具。
2/3/2025 12:16:01 PM
机器之心
NeurIPS | 对比采样链:让扩散模型更快、更准、更清晰的秘密武器
论文 Contrastive Sampling Chains in Diffusion Models 的精炼解读。 一眼概览该论文提出了一种 对比采样链(Contrastive Sampling Chains, CSC) 方法,通过对比损失和得分匹配相结合,优化扩散模型(DMs)的采样过程,从而 减少离散化误差,提高生成图像的质量,同时提升采样速度。 核心问题扩散模型在使用数值求解方法进行采样时 不可避免地引入离散化误差,导致生成样本与真实数据分布之间存在偏差。
2/3/2025 10:04:47 AM
萍哥学AI
DeepSeek 实现任务调度分片算法 , 灵性十足,远超预期 !
这几天,中国人工智能公司 DeepSeek 火了,不仅在美区下载榜上超越了 ChatGPT ,还引发多个美国科技股的股价暴跌。 美国总统特朗普称 DeepSeek 的出现“给美国相关产业敲响了警钟”。 于是,怀着极强的好奇心,我尝试让 DeepSeek V3 模型帮我完成任务调度系统分片功能,流程见下文。
2/3/2025 10:00:00 AM
勇哥
DeepSeek R1 简易指南:架构、本地部署和硬件要求
DeepSeek 团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。 该研究突破性地采用强化学习(Reinforcement Learning)作为核心训练范式,在不依赖大规模监督微调的前提下显著提升了模型的复杂问题求解能力。 技术架构深度解析模型体系:DeepSeek-R1系列包含两大核心成员:DeepSeek-R1-Zero参数规模:6710亿(MoE架构,每个token激活370亿参数)训练特点:完全基于强化学习的端到端训练核心优势:展现出自我验证、长链推理等涌现能力典型表现:AIME 2024基准测试71%准确率DeepSeek-R1参数规模:与Zero版保持相同体量训练创新:多阶段混合训练策略核心改进:监督微调冷启动 强化学习优化性能提升:AIME 2024准确率提升至79.8%训练方法论对比强化学习与主要依赖监督学习的传统模型不同,DeepSeek-R1广泛使用了RL。
2/3/2025 6:00:00 AM
dev
ChatGPT 被逼急了,连夜上线 o3-mini,并且还免费......
也许是迫于 DeepSeek 的压力,open ai 的负责人 萨姆·奥尔特曼,连发多个 Twitter(现在是 X) 推出了新的模型 o3-mini,并且包含三个版本:low、medium 和 high,分别针对不同的性能和资源需求优化。 图片现在,只要大家打开 chatgpt 的官网,就可以看到大大的 o3-mini 的宣传海报:图片图片虽然 o3-mini 的具体性能还没有经过广泛的实战验证,但是一些第三方的初步评测已经流出。 尤其是发布 几个小时后,加州大学的一位 AI 博士就对包括 o3-mini 在内的多款大语言模型进行了测试,评测指标包括 Accuracy(准确率) 和 Calibration Error(校准误差)图片根据评测结果可以看到,在他的评测中 o3-mini (high) 模型的 准确率为 13.0% 为全场最高。
2/3/2025 12:15:00 AM
程序员Sunday
DeepSeek 火爆了,主打高性能低价格!
大家好,我是君哥。 春节这几天,DeepSeek 可以说是火爆了,铺天盖地都是 DeepSeek 的报道。 今天,我们一起学习一下 DeepSeek。
2/3/2025 12:00:15 AM
朱晋君
硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
顶级“礼遇”。 一觉醒来,OpenAI和Claude母公司都对DeepSeek出手了。 据《金融时报》消息,OpenAI表示已经发现证据,证明DeepSeek利用他们的模型进行训练,这涉嫌侵犯知识产权。
2/3/2025 12:00:10 AM
全面梳理200+篇前沿论文,视觉生成模型理解物理世界规律的通关密码,都在这篇综述里了!
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/2/2025 11:41:00 PM
机器之心
万字长文解读Scaling Law的一切,洞见LLM的未来
Scaling Law 撞墙了吗? 这算得上是近段时间 AI 领域最热门的话题之一。 近日,资深机器学习研究科学家 Cameron R.
2/1/2025 7:58:00 PM
机器之心
赛博树突觉醒!AI 仿生革命:更少参数,更强性能,过拟合?不存在的!
编辑丨&人工神经网络(ANN)是大多数深度学习(DL)算法的核心,这些算法可以成功解决图像识别、自动驾驶和自然语言处理等复杂问题。 然而,与能够高效解决类似问题的生物大脑不同,DL 算法需要大量可训练参数,这使得它们能耗高且容易过拟合。 来自希腊研究与技术基金会两位研究员示了一种新的 ANN 架构,它结合了生物树突的结构化连接和受限采样特性,抵消了这些限制。
2/1/2025 3:04:00 PM
ScienceAI
Nature发布:2025年值得关注的七项技术
编辑 | 20492025 年,全球科技发展正以惊人的速度重塑人类社会的未来。 在气候危机、疾病威胁与资源短缺的多重压力下,技术创新聚焦于两大核心方向:可持续性与人工智能(AI)的深度结合。 《Nature》盘点了今年将密切关注的七项技术,从实验室的自动化革命到城市的生态改造,从精准医疗到环境修复,七项技术不仅加速科学发现,更试图为人类提供应对复杂挑战的规模化方案。
2/1/2025 3:03:00 PM
ScienceAI
David Baker 利用 AI 设计蛋白质,一招制蛇毒,或将彻底改变蛇咬治疗
编辑丨&蛇中毒是一种严重的个人健康威胁,每年导致约 10 万人死亡和 30 万人永久残疾,尤其是在医疗资源匮乏的地区。 目前的抗蛇毒血清主要依赖于动物血浆提取的多克隆抗体,存在成本高、副作用大、对某些毒素效果有限等问题。 今年诺贝尔化学奖得主 David Baker 团队的一项研究揭示了蛇咬伤治疗可能改变游戏规则。
1/30/2025 12:03:00 PM
ScienceAI
CityDreamer4D: 下一个世界模型,何必是视频生成模型?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
1/28/2025 1:19:00 PM
机器之心
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
1/28/2025 1:08:00 PM
机器之心
验证速度提升25倍,准确率达95.1%,清华团队提出基于物理信息学习的电池衰减预测方法
图 1:研究概念图。 编辑 | ScienceAI随着全球对可再生能源需求的日益增长,电池作为储能系统关键技术的地位愈发凸显。 然而,电池研发过程中面临着从材料原型到商业产品转化的重重挑战,电池原型验证效率低、研发成本高以及生产废料管理不善等问题制约着电池行业的可持续发展。
1/27/2025 7:13:00 PM
ScienceAI
闲来无事,我测了测国产大模型的RAG能力 新智元 新智元 2025年01月27日 12:25 北京
最近,AI界被推理模型刷屏了。 国内各家的推理模型,在新年到来之际不断刷新我们的认知。 不过,当我们在实际应用中考量大模型,衡量好不好用的标准,就绝不仅仅局限于其性能和规模了。
1/27/2025 12:41:00 PM
新智元
资讯热榜
GPT-5 登场?OpenAI 预告北京时间明天凌晨 1 时直播
月之暗面开源 Kimi-K2:万亿参数,超强Agent,全线 SOTA
揭秘大模型的魔法:从Transformer架构开始,一步步揭开它的神秘面纱
19种玩法超全总结!即梦 AI 垫图指南(附提示词)
AI Programming Tools Gradually Shift to Terminal Interface, Future Development May Be Transformed Completely!
ChatGPT Plus 新权益:OpenAI 开放 Record 模式,会议记录的高效 AI 解决方案
从聊天记录到数字资产:MIRIX 让记忆可买卖
Jackywine发布AI数字伴侣“贝拉”:打造可成长的情感智能体
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
Anthropic
英伟达
代码
智能体
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
3D
Claude
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
AI视频
Agent
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
预测
大型语言模型
深度学习
伟达
RAG
Transformer
具身智能
视觉
神器推荐
亚马逊
视频生成
AGI
Copilot
DeepMind
模态
架构
LLaMA