AI模型
DeepSeek R2 或于3月17日发布,将撼动Claude Sonnet 3.7的地位
根据X平台上的最新消息,DeepSeek下一代AI模型DeepSeek R2或将于3月17日正式发布。 这一消息迅速引发业界关注,许多人认为这一新模型可能会对现有AI巨头,如Anthropic的Claude Sonnet3.7,构成强有力的挑战。 据X用户 tanvitabs 今日凌晨发布的帖子透露,DeepSeek R2宣称在多个关键领域实现突破,包括更出色的编程能力、多语言推理能力,以及以更低的成本提供更高的准确性。
3/11/2025 8:51:00 AM
AI在线
华为AI模型生成专利公布,可提升生成AI模型效率
企查查APP显示,近日,华为技术有限公司“一种AI模型的生成方法及装置”专利公布。 企查查专利摘要显示,该专利涉及人工智能技术领域,能够在一定程度上提升生成AI模型的效率、降低资源消耗。 该方法包括:第一处理器基于AI模型的多个算子中的每一个算子的执行时长、每一个算子运行过程中第二处理器的第二内存的内存占用大小以及内存卸载时长,构建以操作指示信息为优化变量的目标优化函数;并且对目标优化函数进行全局寻优,得到用于指示对多个算子中的每一个算子是否执行目标操作的操作指示信息,目标操作包括重计算操作或者内存卸载操作;以及向第二处理器发送包括操作指示信息的调整指令,以指示第二处理器根据操作指示信息执行多个算子以对AI模型进行训练得到目标AI模型。
3/10/2025 11:05:00 AM
AI在线
谷歌 Gemini Embedding:文本嵌入领域的新王者
近日,谷歌推出了其最新的文本处理模型 ——Gemini Embedding,并在 Massive Text Embedding Benchmark(MTEB)中取得了出色的成绩,成为当前性能最强的文本嵌入 AI 模型。 这一消息无疑为 AI 文本处理领域注入了新的活力,令业界瞩目。 Gemini Embedding 能够将文本转换为数值表示(向量),这使得它在语义搜索、推荐系统以及文档检索等应用中表现尤为优异。
3/10/2025 9:56:00 AM
AI在线
AI数字人新突破!Hedra推出Character-3模型和Hedra Studio:对图像、文本和音频进行联合推理
根据Hedra 在X平台上的最新消息,Hedra Studio正式推出了其全新AI模型——Character-3,这一模型被认为是数字人视频生成技术的一次重大飞跃。 Hedra通过整合尖端AI技术,为内容创作者和企业营销人员提供了更高效、更具创意的内容生成工具,标志着AI驱动的叙事方式迈向了新的高度。 Character- 3 模型:多模态融合的创新Character- 3 模型具备同时处理多种输入类型的能力,包括图像、文本和音频,并能将这些元素无缝融合,生成高质量的视频内容。
3/9/2025 11:04:00 AM
AI在线
OpenAI正对macOS版ChatGPT的“应用协作” 功能进行重大更新
OpenAI 其“应用协作” 功能在 macOS 平台上进行重大更新,推出三项新设置以及全新的用户界面。 这些改进虽然尚未向公众开放,但旨在进一步提升 ChatGPT 与各类桌面应用的整合能力,为用户提供更顺畅的操作体验。 首先,新增加的 “自动与聊天栏中的应用配对” 功能能够在用户切换不同的 AI 模型或开启新的聊天时,保持与应用程序的连接。
3/6/2025 11:01:00 AM
AI在线
AI欺骗决策者,我们可能还没有引起注意
近年来,AI技术飞速发展,但随之而来的问题也日益凸显。 最近,AI模型被曝出频繁出现欺骗行为,不仅不服从研究人员指令,还试图逃离限制环境,甚至谎称遵守规则。 这一现象引起了业界的广泛关注。
3/3/2025 7:30:00 AM
Alex Kantrowitz
深度思考:现在的AI模型真的在进行推理吗?
最近,OpenAI、DeepSeek、谷歌、Anthropic都推出新模型,它们都宣称模型已经具备真正的推理能力,也就是人类解决问题时运用的思维方式,但问题在于:AI大模型所说的推理真的和人一样吗? 现在的模型可以将复杂问题分解成小问题,然后逐步解决小问题再给出回应,业界将这个过程称为“思维链推理”。 这些模型有时表现让人惊叹,可以解决逻辑谜题和数学难题,能够快速写出完美代码,但有时面对极为简单的问题却显得蠢笨。
2/27/2025 10:33:36 AM
小刀
谷歌AI视频生成模型Veo 2使用成本曝光:一分钟视频要30美元
谷歌近日悄然公布了其视频生成 AI 模型 Veo2的定价信息,Veo2最早是在去年12月被披露的,这一新模型吸引了不少关注。 根据谷歌的定价页面,使用 Veo2的费用为每秒50美分,这样算下来,每分钟的视频费用为30美元,每小时的视频费用则高达1800美元。 谷歌 DeepMind 的研究员乔恩・巴伦(Jon Barron)对这一定价进行了有趣的比较,他提到了备受瞩目的漫威电影《复仇者联盟:终局之战》的制作预算,该预算高达3.56亿美元,折合每秒约32,000美元。
2/24/2025 9:04:00 AM
AI在线
保姆级教程!小白都能学会的Deepseek本地部署方法
本文教你利用 OpenWebUI 进行本地部署,还可以调用所有的开源大模型,有效提高个人或者企业模型数据的保密程度。 更多DeepSeek 干货:. 掀桌子了!
2/24/2025 12:04:05 AM
果汁
xAI称已面向所有用户免费提供 Grok3 直到他们服务器崩溃
AIbase 2月20日 消息:xAI今日宣布已经正式推出其最新AI模型Grok3,并称其为"世界最聪明的AI"。 该公司表示,Grok3现已免费向公众开放试用,直到"服务器融化"。 新功能与性能根据xAI的公告,Grok3引入了两项新功能:DeepSearch:一个强大的AI代理,能够快速综合关键信息,推理冲突的事实与观点,并从复杂性中提炼出清晰度Think:一个推理模型,特别适合数学、科学和编程任务xAI强调,Grok3在推理、数学、编程、世界知识和指令遵循任务方面表现出色,并在多项基准测试中展现了卓越性能。
2/20/2025 1:34:00 PM
AI在线
腾讯深度思考模型「混元T1」面向所有用户开放
腾讯宣布其深度思考模型“混元T1”正式面向所有用户开放,用户可以通过腾讯元宝平台体验并测试该模型。 此前,混元T1开启灰度测试后,受到了用户的广泛关注和积极反馈。 为了满足用户需求,腾讯紧急部署,现已实现混元T1的全面开放,所有用户均可无限量使用。
2/20/2025 8:51:00 AM
AI在线
联发科推出两款多模态轻量级 AI 模型:主打繁体中文处理能力、基于 Meta Llama 3.2 打造而成
联发科创新基地(MediaTek Research)现已发布两款支持繁体中文的轻量级多模态模型,分别是号称可在手机上运行的 Llama-Breeze2-3B 模型和适用于轻薄笔记本电脑的 Llama-Breeze2-8B 模型。
2/19/2025 8:10:43 PM
漾仔
Anthropic即将发布全新 AI 模型,推理能力再上新台阶
AI 初创公司Anthropic正准备推出其最新的 AI 模型,预计将在未来几周内正式发布。 根据theinformation报道,这款新模型被称为 “混合型” 模型,具备在 “深度推理” 与快速响应之间切换的能力。 这一创新设计旨在为开发者提供更加灵活的工具,以满足不同应用场景的需求。
2/14/2025 10:12:00 AM
AI在线
小米公布AI通信相关专利
企查查APP显示,2月11日,北京小米移动软件有限公司申请的“一种人工智能通信方法、装置及存储介质”专利公布。 专利摘要显示,本公开是关于一种人工智能通信方法、装置及存储介质。 人工智能通信方法包括:确定第一时间,第一时间用于表示基于AI模型处理AI任务的处理时间;基于第一时间,进行基于AI模型的AI通信处理。
2/11/2025 4:37:00 PM
AI在线
LG 的 Exaone AI 模型以成本效率匹敌DeepSeek
近期,美国知名研究机构 Epoch AI 发布了一份报告,正式将 LG 的 Exaone3.532B 模型评选为 “值得注意的 AI” 之一,并在成本效率方面表现尤为突出,与中国的 DeepSeek 不相上下。 LG Exaone3.5模型于2023年12月正式推出,其开发投资约为70亿韩元(约合480万美元),这一成本低于 DeepSeek 开发其 V3模型所花费的600万美元。 Epoch AI 的评估标准主要考虑了模型的性能、使用频率等因素,而这也是两年来首个获得此类认可的韩国 AI 模型,显示了 LG 在人工智能领域的突破性进展。
2/10/2025 4:52:00 PM
AI在线
DeepSeek本地部署教程,小白也能搞定!
安装环境操作系统:Windows 10及以上准备工具:轻量级AI模型调用工具Ollama,调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM(二选一)资源链接:复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型,首先需要一个好用的工具,推荐使用 Ollama ,它是一个轻量级的工具,支持快速安装和运行大语言模型(如deepseek、Llama、Qwen 等)。 ollama下载地址 :官网链接(文章开头)选择合适的操作系统下载,默认安装完成即可。 这里注意,ollama安装完成后先不要启用,因为它默认是会将模型下载到C盘的,deepseek、Qwen等模型最小也有好几个GB会占用C盘空间,所以需要先设置ollama的环境变量。
2/10/2025 11:11:47 AM
小云君网络
人形机器人新秀 Figure 宣布独立研发,终止与OpenAI的合作关系
近日,硅谷人形机器人公司 Figure 通过社交媒体宣布,正式终止与人工智能巨头 OpenAI 的合作。 这一决定令业内人士颇感意外,尤其是 Figure 曾在去年与 OpenAI 达成协议,共同开发新一代面向人形机器人的 AI 模型。 Figure 创始人布雷特・阿德科克(Brett Adcock)表示,公司在端到端机器人 AI 技术上取得了 “重大突破”,因此决定将重心转向自主研发。
2/5/2025 9:45:00 AM
AI在线
英伟达点赞DeepSeek:是“出色的人工智能进步”
国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。 这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。 尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。
1/28/2025 10:50:00 AM
AI在线
资讯热榜
月之暗面开源 Kimi-K2:万亿参数,超强Agent,全线 SOTA
GPT-5 登场?OpenAI 预告北京时间明天凌晨 1 时直播
AI Programming Tools Gradually Shift to Terminal Interface, Future Development May Be Transformed Completely!
从聊天记录到数字资产:MIRIX 让记忆可买卖
Moon's Dark Side Kimi K2 API is Slow, Being Optimized Intensively!
Apple MLX Supports NVIDIA CUDA, AI Developers Benefit from Cost and Efficiency
前 OpenAI 工程师 Calvin 长文回顾工作经历:员工一年间暴增 2000 人,产品发布节奏迅猛
OpenAI离职员工自曝:干了一年就润了!007压力逼到极限,AGI成宗教
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
Anthropic
英伟达
代码
智能体
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
生成式
腾讯
苹果
LLM
神经网络
AI新词
3D
Claude
研究
生成
机器学习
AI for Science
计算
xAI
人形机器人
Sora
AI视频
Agent
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
预测
大型语言模型
深度学习
伟达
RAG
Transformer
具身智能
视觉
神器推荐
亚马逊
视频生成
AGI
Copilot
模态
DeepMind
LLaMA
文本