理论
扩散模型低位量化突破!有效扩散量化的极限推向2-4位,W2A4位宽下FID降低58%,超越SOTA方法
降低扩散模型生成的计算成本,性能还保持在高水平! 最新研究提出一种用于极低位差分量化的混合精度量化方法。 △图1 W2A6位宽下基线和MPQ-DM生成的样本可视化目前,扩散模型在生成任务中受到了广泛关注。
1/20/2025 9:20:00 AM
量子位
返老还童,OpenAI做到了?首个逆龄AI将登场,人类寿命可延长10年
超级智能要来了? 人类「长生不老」有希望了? 外媒称,OpenAI开发出了首款用于「长寿」的AI模型 ——GPT-4b micro,预计将人类寿命延长10年。
1/20/2025 9:13:00 AM
新智元
Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品
一个新框架,让Qwen版o1成绩暴涨:在博士级别的科学问答、数学、代码能力的11项评测中,能力显著提升,拿下10个第一! 这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。 项目团队成员发现,o1和o1类模型在推理过程中表现突出,但却存在“知识不足”的明显缺陷——推理步骤太长/模型知识不足时,推理过程就很容易卡壳,导致推理链中的错误传递。
1/20/2025 9:05:00 AM
量子位
终于把机器学习中的类别不平衡搞懂了!!
今天给大家分享机器学习中的一个关键概念,类别不平衡。 类别不平衡指的是在分类问题中,不同类别的数据样本数量相差悬殊的情况。 在机器学习和深度学习的应用中,类别不平衡是一个常见的问题,尤其是在一些实际场景中,某些类别的数据相对较少,而其他类别的数据较多。
1/20/2025 9:00:00 AM
程序员小寒
时间序列计量经济学中的主要因果推断方法总结
经济时间序列中的因果关系研究已超越了传统的相关性分析范畴。 本文系统性地探讨了时间序列经济数据中因果关系的识别与量化方法,涵盖从经典的格兰杰因果检验到现代因果推断技术的全方位论述。 格兰杰因果检验格兰杰因果检验是评估时间序列预测能力的基础性计量工具,用于检验一个时间序列对另一个时间序列的预测贡献。
1/20/2025 8:50:00 AM
Kyle Jones
DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键
DeepSeek版o1,有消息了。 还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAI o1的中档推理设置相当。 注意了,这不是在DeepSeek官方App已经能试玩的DeepSeek-R1-Lite-Preview(轻量预览版)。
1/20/2025 8:46:00 AM
量子位
代码生成「神⋅提示」,比新手程序员快100倍!地位堪比make it more X
2023年11月,在ChatGPT支持DALL-3功能后,一个爆火的图像生成玩法是,不断迭代提示词「make it more X」,生成的图片越来越抽象。 圣诞老人越来越严肃把这个思路用在LLM任务上,比如代码生成,会怎么样? 最近,BuzzFeed的高级数据科学家Max Woolf在博客上分享了一个实验,通过设计不同的提示词、不断迭代模型输出,最终实现代码性能的100倍提升!
1/20/2025 8:17:00 AM
新智元
OpenAI员工疯狂暗示,内部已成功开发ASI?被曝训出GPT-5但雪藏
种种迹象表明,最近OpenAI似乎发生了什么大事。 AI研究员Gwern Branwen发布了一篇关于OpenAI o3、o4、o5的文章。 根据他的说法,OpenAI已经跨越了临界点,达到了「递归自我改进」的门槛——o4或o5能自动化AI研发,完成剩下的工作!
1/20/2025 7:30:00 AM
新智元
5090跑《黑神话》飙到200+帧,英伟达DLSS也用上Transformer了
现在,打个游戏都用上Transformer了? 老黄的DLSS进行了一波大升级,换上了基于Transformer的新大脑。 用上新模型之后,光线重建和超分辨率,效果都变得更细腻了。
1/20/2025 7:00:00 AM
量子位
Perplexity寻求与TikTok合并,网友:饿疯了。特朗普采访透露:给TikTok90天时间是不错的选择,可能会考虑
出品 | 51CTO技术栈(微信号:blog51cto)美东时间,本周五在最高法院宣布维持对 TikTok “不出售就停用”的决定后,没想到很快就迎来了新进展。 据 CNBC 报道,AI 搜索领域的当红小生 Perplexity AI 于周六正式对 TikTok 发出竞购合并请求,CEO Aravind Srinivas 已经向 TikTok母公司字节跳动提交了一份竞标报价,计划将 Perplexity、TikTok US 和新的资本合作伙伴合并成一个新的实体。 据一位知情人士透露,新的结构将允许字节跳动的大多数现有投资者保留其股权,同时为 Perplexity 提供更多的视频。
1/19/2025 1:52:29 PM
「完美的搜索引擎」是否存在?这家公司向谷歌发起挑战
你需要一群拒绝接受现状的人,并为之努力多年,直到一个抽象的愿景变为现实,即使其他人都不理解。 你每天都在用的搜索引擎,可能并不完美。 大型语言模型(LLMs)能够解决研究生水平的数学问题,但今天的搜索引擎却无法准确理解一个简单的三词短语。
1/18/2025 6:35:00 PM
机器之心
美国最高法院最终裁定:维持TikTok禁令,特朗普发帖回应:意料之中应该尊重,但是否执行有待时间考虑,周受资或出席特朗普就职典礼
美最高法院最后裁定结果出来了:维持 TikTok 禁令。 美东时间,本周五,最高法院一致决定站在拜登政府一边,维持拜登总统今年 4 月 签署的《保护美国人免受外国对手控制应用法案》 。 最高法院的意见称:“毫无疑问,对于超过 1.7 亿美国人来说,TikTok 提供了一个独特而广阔的表达渠道、参与方式和社区来源。
1/18/2025 4:35:41 PM
51CTO技术栈
资讯热榜
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
DeepRare 重磅发布:全球首个可循证智能体诊断系统,直击医学Last Exam难题
考试提分新工具:网页版 ChatGPT 测试“学习和掌握”功能,AI 助你成学霸
我测试了100+案例,教你零基础复刻外网刷屏的 AI 视频(附提示词模板)
AI时代设计师如何突围?D20峰会揭示未来设计师生存法则
一盘大棋!OpenAI「截胡」IMO金牌,奥特曼为GPT-5献上「核弹级」预热
终结Coding?ShellAgent三句话造出马斯克同款「AI女友」!
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
英伟达
Anthropic
智能体
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
Agent
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
大型语言模型
预测
具身智能
深度学习
伟达
视觉
Transformer
神器推荐
AGI
亚马逊
视频生成
Copilot
DeepMind
模态
架构
LLaMA