AI模型
LG 的 Exaone AI 模型以成本效率匹敌DeepSeek
近期,美国知名研究机构 Epoch AI 发布了一份报告,正式将 LG 的 Exaone3.532B 模型评选为 “值得注意的 AI” 之一,并在成本效率方面表现尤为突出,与中国的 DeepSeek 不相上下。 LG Exaone3.5模型于2023年12月正式推出,其开发投资约为70亿韩元(约合480万美元),这一成本低于 DeepSeek 开发其 V3模型所花费的600万美元。 Epoch AI 的评估标准主要考虑了模型的性能、使用频率等因素,而这也是两年来首个获得此类认可的韩国 AI 模型,显示了 LG 在人工智能领域的突破性进展。
2/10/2025 4:52:00 PM
AI在线
DeepSeek本地部署教程,小白也能搞定!
安装环境操作系统:Windows 10及以上准备工具:轻量级AI模型调用工具Ollama,调用AI模型为deepseek-r1AI 模型管理工具Cherry-Studio或AnythingLLM(二选一)资源链接:复制安装步骤第一步、下载安装Ollama并修改环境变量要运行大模型,首先需要一个好用的工具,推荐使用 Ollama ,它是一个轻量级的工具,支持快速安装和运行大语言模型(如deepseek、Llama、Qwen 等)。 ollama下载地址 :官网链接(文章开头)选择合适的操作系统下载,默认安装完成即可。 这里注意,ollama安装完成后先不要启用,因为它默认是会将模型下载到C盘的,deepseek、Qwen等模型最小也有好几个GB会占用C盘空间,所以需要先设置ollama的环境变量。
2/10/2025 11:11:47 AM
小云君网络
人形机器人新秀 Figure 宣布独立研发,终止与OpenAI的合作关系
近日,硅谷人形机器人公司 Figure 通过社交媒体宣布,正式终止与人工智能巨头 OpenAI 的合作。 这一决定令业内人士颇感意外,尤其是 Figure 曾在去年与 OpenAI 达成协议,共同开发新一代面向人形机器人的 AI 模型。 Figure 创始人布雷特・阿德科克(Brett Adcock)表示,公司在端到端机器人 AI 技术上取得了 “重大突破”,因此决定将重心转向自主研发。
2/5/2025 9:45:00 AM
AI在线
英伟达点赞DeepSeek:是“出色的人工智能进步”
国产大模型公司DeepSeek的应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,超越了ChatGPT。 这一成就不仅引起了市场的广泛关注,也对AI芯片龙头英伟达的股价产生了重大影响。 尽管如此,英伟达发言人仍然对DeepSeek给出了高度评价,称其为AI领域的一项卓越进步,并指出DeepSeek的工作展示了如何利用测试时间缩放技术、广泛可用的模型以及符合出口管制的计算资源来创建新型号。
1/28/2025 10:50:00 AM
AI在线
Grok-3 内部测试曝光:xAI 欲打造“真理AI”,或将下周发布
据报道,虽然xAI官方尚未正式公布,但其最新模型 Grok-3 已短暂现身独立平台和X平台,并开启内部测试,预示着其正式发布已近在咫尺,有望于下周正式亮相。 有迹象表明,Grok-3的发布或将成为 AI 领域又一重大事件,有望成为目前最先进的 AI 模型。 据悉,Grok-3在回答问题方面的表现非常出色,在某些测试中甚至超越了 OpenAI 的 o1和 DeepSeek R1等领先模型。
1/27/2025 11:23:00 AM
AI在线
胜过Transformer?谷歌推出新型AI模型架构Titans
自2017年推出以来,Transformer模型架构一直是人工智能的基础要素,推动了自然语言处理、机器翻译等领域的进步。 不过,该模型在可扩展性、计算效率以及应对日益复杂任务等方面,仍面临着诸多挑战。 而Titans模型架构的诞生,旨在通过整合受人类认知过程启发的机制来克服这些障碍,如记忆优先级和适应性注意力。
1/26/2025 1:20:49 PM
Yu
OpenAI 新福利:ChatGPT 用户可免费体验o3-mini
近日,OpenAI 的首席执行官阿尔特曼宣布,新的推理 AI 模型 o3-mini 将于近期正式向 ChatGPT 用户推出,涵盖免费和付费用户。 这一新模型是 o1推理模型的继任者,经过自去年12月内测以来的持续优化,旨在为用户提供更加高效、易用且经济的高级推理 AI 服务。 o3-mini 模型在特定任务的微调上取得了显著进展,使得其在处理各种复杂问题时,能够更快速、更准确地响应用户需求。
1/25/2025 3:37:00 PM
AI在线
发烧友!一国外软件工程师买下OGOpenAI.com域名并重定向至DeepSeek
最近,一位软件工程师安纳奈・阿罗拉(Ananay Arora)以 “不到一顿 Chipotle 餐” 的价格购买了域名 OGOpenAI.com,并将其重定向至中国的 AI 实验室 DeepSeek。 这个决定引发了许多人的关注,因为 DeepSeek 近期在开源 AI 领域中取得了显著进展,成为了热议的话题。 DeepSeek 发布的 AI 模型在技术上与早期的 OpenAI 模型相似,能够离线使用,并且任何具备相应硬件的开发者都可以免费使用。
1/24/2025 10:31:00 AM
AI在线
Hugging Face 推出小巧AI模型,助力设备性能提升
近期,人工智能开发平台 Hugging Face 团队发布了两款新型 AI 模型,SmolVLM-256M 和 SmolVLM-500M。 他们自信地声称,这两款模型是目前为止体积最小的 AI 模型,能够同时处理图像、短视频和文本数据,尤其适合内存少于1GB 的设备如笔记本电脑。 这一创新让开发者在处理大量数据时,能够以更低的成本实现更高的效率。
1/24/2025 10:13:00 AM
AI在线
人工智能席卷华尔街,高盛为其员工推出了AI助手
华尔街在人工智能技术的应用上走在了前沿,尤其是生成式人工智能的迅猛发展。 高盛近日宣布推出一款名为 “GS AI 助手” 的生成式 AI 工具,旨在帮助其银行家、交易员和资产经理更高效地完成工作。 这一工具目前已向约1万名员工推出,预计在今年内将覆盖所有知识工作者。
1/23/2025 4:49:00 PM
AI在线
DeepSeek新AI模型有多震撼?外媒:相当于30美元iPhone降临
DeepSeek(深度求索)再次推出新版开源AI模型,它的性能与美国最先进的AI模型虽然还有一些差距,但差距极小,成本低很多很多。 西方许多人认为,美国限制中国AI发展的企图遇挫,中国正在加速前进,以更高效率打造高端AI模型。 去年12月,杭州幻方量化推出DeepSeekV3开源大语言模型,它的性能与OpenAI 40和Anthropic Claude 3.5 .
1/23/2025 3:58:02 PM
小刀
Sam Altman称OpenAI将在几周内发布推理AI模型o3-mini
为了在人工智能技术竞赛中保持领先地位,OpenAI现在已经准备好了最新的人工智能模型,名为“o3-mini”该公司已经完成了其最新推理AI模型的第一个版本,OpenAI首席执行官Sam Altman在他的X帖子中证实了这一点。 经过外部安全研究人员的测试,新模型将在几周内推出。 值得注意的是,在2024年12月,ChatGPT制造商正式宣布开发和测试其先进的推理模型——o3和o3-mini。
1/20/2025 7:52:50 PM
Yu
英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC
据英伟达官方博客,英伟达宣布推出一款名为 Nemotron-CC 的大型英文 AI 训练数据库,总计包含 6.3 万亿个 Token,其中 1.9 万亿为合成数据。英伟达声称该训练数据库可以帮助为学术界和企业界进一步推动大语言模型的训练过程。
1/13/2025 9:18:27 PM
漾仔
如何使用基于AI的 Suno创作自己的音乐?
译者 | 布加迪审校 | 重楼Suno将使用其AI技能根据你对音乐的特定流派和主题的描述来创作歌曲。 你可能已经使用生成式AI来创建文本、图像甚至视频,但有没有用它来创作自己的音乐呢? 几种不同的文本转音乐工具可以充当虚拟作曲家,不过值得一试的此类工具是Suno。
1/10/2025 7:53:13 AM
布加迪
一文看懂推理并行的定义及其工作原理
译者 | 布加迪审校 | 重楼近年来,我们见证了两个反复出现的趋势:发布的GPU功能越来越强大,以及拥有数十亿、乃至数万亿个参数和加长型上下文窗口的大语言模型(LLM)层出不穷。 许多企业正在利用这些LLM,或进行微调,或使用RAG构建具有特定领域知识的应用程序,并将其部署在专用GPU服务器上。 现在说到在GPU上部署这些模型,需要注意的一点是模型大小,即相比GPU上的可用内存,将模型加载到GPU内存中所需的空间(用于存储参数和上下文token)实在太大了。
1/9/2025 11:14:14 AM
布加迪
微软发布2025年六大AI预测:AI模型将变得更加强大和有用
微软在2025年对人工智能(AI)的未来做出了六项重要预测,包括AI模型将变得更加强大和有用、AI . Agents将彻底改变工作方式、AI伴侣将支持日常生活、AI资源的利用将更高效、测试与定制是开发AI的关键、AI将加速科学研究突破。 以下是微软的预测及其潜在影响的详细解读:一、AI模型将变得更加强大和有用推理效率和功能提升:过去一年中,AI模型在推理效率和功能方面取得了显著进步。
1/6/2025 12:59:52 PM
极客AI
如何在安卓手机上本地安装和运行LLM?
译者 | 布加迪审校 | 重楼了解如何将AI的力量径直带入到你的安卓手机上:没有云,没有互联网,只有纯粹的设备端智能! 在安卓手机上本地运行大语言模型(LLM)意味着你可以在不依赖云服务器或互联网连接的情况下访问人工智能(AI)模型。 这种本地环境通过确保数据安全、并在设备端来确保隐私。
12/12/2024 8:26:50 AM
布加迪
你永远不应该外包给AI模型的一件事
在这个效率至上、颠覆性创新能一夜之间创造出亿万美元市场的世界里,企业不可避免地将GenAI视为强大的盟友。 从OpenAI的ChatGPT生成类似人类的文本,到DALL-E根据提示创作艺术,我们已经窥见了一个未来:机器将与人类并肩创造,甚至引领潮流。 为何不将这种趋势延伸到研发(R&D)领域呢?毕竟,AI可以加速创意生成,迭代速度超过人类研究人员,并且可能以惊人的轻松发现“下一个大事件”,对吗?且慢,理论上这一切听起来都很美好,但让我们面对现实:押注GenAI接管你的研发工作,很可能会以重大、甚至灾难性的方式适得其反。
12/10/2024 8:34:28 AM
Ashish Pawar
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用