理论
改进云基础设施以实现通用人工智能AGI
人工通用智能(AGI)是人工智能领域最具雄心的目标。 AGI旨在模拟类似人类的认知能力,包括在不同领域的推理、理解和学习。 当前的云基础设施尚不足以支持AGI系统所需的计算和学习需求。
2/14/2025 4:08:19 PM
被AI妆到了!DeepSeek教网友化妆,竟像极了「石矶娘娘」
AI好好用报道编辑:杨文DeepSeek的风吹到了美妆区。 DeepSeek 又又又来搞抽象了! 继上次做人类从未见过的菜之后,网友又想到了个新路数:教化妆。
2/14/2025 3:49:00 PM
AI好好用
Grok 3两周内发布,要夺回大模型王座;DeepSeek现象后,AI会改变方向…蔡崇信、李彦宏、马斯克,大佬们在迪拜峰会说了啥
出品 | 51CTO技术栈(微信号:blog51cto)2025年世界政府峰会于2月11日在阿联酋迪拜开幕,不少科技大佬都参与了峰会,并表达了自己的真知灼见。 在这个关口谈论科技创新,AI无可避免地成为了绝对的主角。 马斯克吹捧Grok 3将成为有史以来最聪明的AI,“这(指新模型发布之前)可能是其他模型最后一次超过Grok”。
2/14/2025 3:18:27 PM
实锤!李彦宏要搞开源!!!百度官宣:文心大模型4.5系列将开源,6月30日见真章,继文小言免费后的又一大动作
出品 | 51CTO技术栈(微信号:blog51cto)好家伙! ! 字少事大啊!
2/14/2025 11:45:37 AM
模型过剩危机:OpenAI壮士断腕,能否终结开发者'选择恐惧症'?
OpenAI要“动手”了,它计划对自己的模型产品阵容来一场大“瘦身”!就在它准备推出最后一个非推理模型GPT-4.5之际,这家科技巨头罕见地承认,之前的产品发布在客户眼里竟然没啥区别,这让市场有点懵。 OpenAI的首席执行官萨姆·奥特曼最近在X平台上更新了产品路线图,他坦诚地说,公司最近的一些发布确实让市场感到有点困惑。 “我们得把预定路线图分享得更清楚,还得在产品阵容简化上多下点功夫。
2/14/2025 11:25:45 AM
Emilia David
信我,有你想要的!最大化DeepSeek潜能:动态注意力机制
deepseek原理 应用 实践,和大家分享:小众的,deepseek核心技术原理;大众的,提示词要怎么写;今天和大家聊聊,deepseek的核心技术之一的动态注意力机制。 要搞懂这个,先得知道什么是注意力机制? 这是一种通过计算…查询向量(Query)…键向量(Key)…值向量(Value)…,最终得到...的技术。
2/14/2025 11:22:34 AM
58沈剑
Anthropic秘密「混合模型」 Claude 4首曝细节,硬刚GPT-5!深度推理模型来了
Anthropic终于要开始搞点事情啦! 近期的「推理模型」热潮中,Anthropic除了其CEO打了几个嘴炮外,还没有掏出一个拿得出手的产品。 在这样下去,可能要退出AI一线模型玩家行列了。
2/14/2025 11:18:57 AM
新智元
全面超越OccWorld!Occ-LLM:Occ世界模型再度问鼎SOTA
写在前面&出发点大语言模型(LLMs)在机器人和自动驾驶领域取得了重大进展。 本研究提出了首个基于占用的大语言模型(Occ-LLM),这是将大语言模型与一种重要表示方式相结合的开创性尝试。 为了有效地将占用信息编码为大语言模型的输入,并解决与占用相关的类别不平衡问题,研究提出了运动分离变分自编码器(MS-VAE)。
2/14/2025 10:56:58 AM
Tianshuo Xu等
1秒锁定7500万债务黑洞,OpenAI o系列模型7大实际应用案例
今早5点,OpenAI分享了o系列模型的7大实际应用场景,包括处理模糊任务、从海量信息中提取关键信息、复杂文档推理与决策、多流程AIAgent、视觉推理、代码审查以及性能评估。 在这些实际案例中,一家金融分析平台通过o系列模型成功找出了影响收购的关键变更条款,帮助公司节省了7500万美元。 此外,还解读了o系列推理模型与效率型GPT系列模型的区别,帮助你在实际应用中该如何高效选择这两种模型。
2/14/2025 10:44:13 AM
AIGC开放社区
报告:DeepSeek爆火激发山寨网站数量激增,超六成解析IP来自美国
尽管美国出台法律禁止下载和使用DeepSeek,甚至对违规者处以最高20年的刑期,但这一措施似乎并未遏制美国人对DeepSeek的兴趣,反而催生了大量山寨网站。 据奇安信XLab实验室的统计,从2024年12月1日至2025年2月3日的两个多月时间里,互联网上出现了2650多个山寨DeepSeek域名。 尤其是自2025年1月26日起,山寨域名开始大规模涌现,并在1月28日达到高峰,当天新增山寨域名超过800个。
2/14/2025 10:40:00 AM
DeepSeek数学大翻车?普林斯顿谷歌锤爆LLM:做题不会推理,全靠死记硬背
破案了! 就在刚刚,来自普林斯顿和谷歌的研究者发现——大模型做数学题,不是靠推理,而是靠从训练集里记下的解题技巧! 论文地址:「未解之谜」一直困扰着不少业内人士:在数学上,LLM到底是学会了举一反三,还是只是学会了背题?
2/14/2025 10:23:00 AM
新智元
IDC预测:2028年AI推动的智能手机支出将达320亿美元,客户体验进入智能化时代
根据IDC的最新预测,到2028年,消费者通过智能手机上独立运行的人工智能代理进行商品和服务购买的支出将达到320亿美元。 这一趋势表明,人工智能将在客户体验领域发挥至关重要的作用,尤其是在为客户提供高度个性化体验方面,帮助企业在激烈的市场竞争中脱颖而出。 客户体验的AI转型趋势客户体验定价重构到2028年,预计40%的客户体验供应商将转向基于结果的定价模式。
2/14/2025 10:20:00 AM
AI 网关对决:Higress 与 OneAPI 的功能对比
什么是 AI 网关? AI 网关旨在统一管理与各种大型语言模型(LLMs)的交互。 通过提供单一入口点,它解决了使用来自不同供应商的多个 AI 模型所带来的复杂性问题。
2/14/2025 10:16:15 AM
cr7258
移远通信边缘计算模组成功运行DeepSeek模型,以领先的工程能力加速端侧AI落地
近日,国产大模型DeepSeek凭借其“开源开放、高效推理、端侧友好”的核心优势,迅速风靡全球。 移远通信基于边缘计算模组SG885G,已成功实现DeepSeek模型的稳定运行,并完成了针对性微调。 目前,该模型正在多款智能终端上进行深入测试与优化。
2/14/2025 10:00:00 AM
手机大厂“敲定”AI伙伴:苹果选阿里,三星选智谱,DeepSeek为何被冷落?
在AI手机的浪潮中,市场传出苹果和三星纷纷选择了自己的合作伙伴,其中苹果将牵手阿里,三星拥抱了智谱,而当下备受瞩目的DeepSeek却意外落选。 分析认为,苹果在选择AI合作伙伴时,不仅看重技术实力,更看重合作伙伴的“实战经验”。 DeepSeek虽然在技术上有着亮眼的表现,但其团队规模较小,缺乏服务像苹果这样大型客户的经验。
2/14/2025 9:50:00 AM
舒云
Seed Research | 视频生成模型最新成果,可仅靠视觉认知世界!现已开源
视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。 不同于 Sora 、DALL-E 、Midjourney 等主流多模态模型,VideoWorld 在业界首次实现无需依赖语言模型,即可认知世界。 正如李飞飞教授 9 年前 TED 演讲中提到 “幼儿可以不依靠语言理解真实世界”,VideoWorld 仅通过 “视觉信息”,即浏览视频数据,就能让机器掌握推理、规划和决策等复杂能力。
2/14/2025 9:30:00 AM
豆包大模型团队
英伟达黑科技登场!RTX神经纹理压缩,显存用量狂减96%
在显卡技术不断迭代的当下,NVIDIA再次凭借其前沿创新,吸引了全球科技爱好者的目光。 RTX神经纹理压缩(NTC)技术在beta测试演示中的表现,堪称惊艳。 它成功地将3D应用中的内存纹理占用大幅降低,最高降幅可达96%,为图形处理领域带来了全新的变革可能。
2/14/2025 9:30:00 AM
新智元
JDK1.8也可以对接DeepSeek-R1,你知道吗?
什么是ai4j首先,我们先了解一下什么是ai4jAI4J 是一款 Java SDK,用于快速接入 AI 大模型应用。 它能整合多平台大模型,如 OpenAI、Ollama、智谱 Zhipu(ChatGLM)、深度求索 DeepSeek、月之暗面 Moonshot(Kimi)、腾讯混元 Hunyuan、零一万物(01)等,为用户提供快速整合 AI 的能力。 其特点包括提供统一的输入输出(对齐 OpenAI)以消除差异化,优化函数调用(Tool Call)和 RAG 调用,支持向量数据库(如 Pinecone),并且支持 JDK1.8,能满足很多仍在使用 JDK8 版本的应用需求。
2/14/2025 9:21:04 AM
了不起
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
Anthropic
腾讯
研究
神经网络
3D
计算
生成
Sora
机器学习
AI设计
AI for Science
苹果
GPU
训练
AI视频
华为
搜索
Claude
场景
人形机器人
百度
智能体
xAI
预测
伟达
大语言模型
深度学习
Transformer
字节跳动
模态
LLaMA
文本
具身智能
神器推荐
Copilot
视觉
驾驶
API
应用
Agent
算力
大型语言模型
工具
安全
干货合集
视频生成