资讯列表
七彩虹推出 “虹光 AI” 助手接入全速版 DeepSeek
七彩虹科技正式宣布,其全新的 “虹光 AI” 智能模型助手已全面接入满血版 DeepSeek R1模型。 这一升级使得七彩虹的笔记本产品在性能和推理效率上得到了显著提升。 此次更新的 “虹光 AI” 助手,基于当前热门的 Transformer 架构,并采用了 MLA 与 Deep Seek MoE 技术,显著降低了内存占用,减少了缓存需求,从而提升了整体的推理效率。
2/8/2025 5:57:00 PM
AI在线
腾讯发布大语言模型训练新专利,提升模型泛化与准确性
近日,腾讯科技(深圳)有限公司在天眼查 App 上公布了一项关于大语言模型的训练方法及相关设备的专利。 这项专利的名称为 “大语言模型的训练方法、装置、计算机设备及存储介质”,旨在通过创新的训练方式,提升大语言模型的学习能力和准确性。 在大语言模型的训练过程中,传统方法往往依赖于单一的文本摘要,可能导致模型过拟合,生成内容的准确性和多样性受到影响。
2/8/2025 5:52:00 PM
AI在线
七彩虹“虹光 AI”智能模型助手官宣接入满血 DeepSeek R1
其基于 Transformer 架构,采用了 MLA 和 Deep Seek MoE 技术,通过减少缓存显著降低了内存占用,提升了推理效率。
2/8/2025 5:48:14 PM
清源
外国专家解读DeepSeek:预算有限,如何复制R1推理模型?纯强化学习不现实!不是任何问题都得问DeepSeek!
出品 | 51CTO技术栈(微信号:blog51cto)Sebastian Raschka是一位外国知名的AI专家。 特别在大型语言模型(LLM)研究方面,有着丰富的研究经验。 近日DeepSeek-R1推理模型的推出,将“任何一款不是o1的模型快速蒸馏成具备强推理能力的o1”成为了可能,而且所需的成本和算力都大大降低。
2/8/2025 5:47:08 PM
Meta 涉嫌非法下载数 TB 盗版电子书,邮件泄露引发关注
最近,Meta 公司在人工智能训练方面的做法受到广泛关注。 根据一项诉讼,这家公司被指控在未获得授权的情况下,下载了大量盗版电子书和文章,用于训练其人工智能模型。 此次事件的核心是几封泄露的电子邮件,这些邮件为 Meta 的行为提供了进一步的证据。
2/8/2025 5:45:00 PM
AI在线
全球最快四足机器人“黑豹”诞生:浙大杭州国际科创中心造,每秒能跑 10 米
据央视新闻今日报道,浙江大学杭州国际科创中心最新推出了全球最快四足机器人“黑豹”,其整体重量为38公斤,站立高度0.63米。
2/8/2025 5:38:07 PM
清源
百度智能云推出四款新应用接入 DeepSeek,助力各行业智能化升级
近日,百度智能云正式推出了四款全新应用 —— 客悦、曦灵、一见和甄知,这些应用已成功接入最新版本的 DeepSeek 模型。 这一举措不仅为企业提供了更为丰富的人工智能解决方案,还旨在满足在智能外呼、数字人视频脚本生成、视觉智能分析及知识管理等高价值业务场景中的多样化需求。 随着数字化转型的加速,百度智能云也在积极推进各行业的应用落地,包括金融、交通、政务、汽车、医疗及工业等领域。
2/8/2025 5:22:00 PM
AI在线
百度智能云:客悦、曦灵、一见、甄知四款大模型应用已接入 DeepSeek
百度智能云正加速推进金融、交通、政务、汽车、医疗、工业等行业应用产品与DeepSeek模型的适配验证工作,积极探索大模型在智能问数、公文写作、理财助手、合规管理、医疗辅诊等行业垂直业务场景中的能力拓展与应用进化。
2/8/2025 5:20:00 PM
清源
中国AIGC产品全景图谱全面征集|量子位智库||征集截止时间
量子位智库 发自 凹非寺. 量子位|公众号 QbitAI2024年是国内AI产品风云变幻的一年。 经历了抢鲜发布、市场教育、多方混战、用户检验过后,优秀的AI产品纷纷站稳脚跟,新的场景与功能也切实改写着大众的工作与生活。
2/8/2025 5:01:20 PM
量子位的朋友们
OpenAI公开了大模型o3-mini的推理思维链
2月8日消息,据外媒报道,OpenAI更新了o3-mini AI模型的“思维链”功能,让用户可以看到模型的思考过程。 这是在DeepSeek-R1发布之后发生的,DeepSeek-R1是一个竞争对手的推理模型,也显示了其反应背后的思维过程。 推理模型旨在逐步分解其决策过程,因此需要更长的时间来生成响应。
2/8/2025 5:00:11 PM
Yu
NeurIPS 2024 | 用LLM探寻隐秘的因果世界
因果发现的现实挑战:稀缺的高级变量寻找并分析因果关系是科学研究中的重要一环,而现有的因果发现算法依赖由专家预先定义的高级变量。 现实场景中的原始数据往往是图片、文本等高维非结构化数据, 结构化的高级变量是十分稀缺的,导致现有的因果发现和学习算法难以用于至更广泛的数据。 因此,香港浸会大学与MBZUAI、卡内基梅隆大学、香港中文大学、悉尼大学以及墨尔本大学合作发表论文《Discovery of the Hidden World with Large Language Models》,提出了一个名为 COAT 的新型框架,旨在利用大型语言模型和因果发现方法的优势,突破传统因果发现方法的局限性,更有效地在现实世界中定义高级变量、理解因果关系。
2/8/2025 4:56:00 PM
新闻助手
工业AI革命将继续由人类推动
现在是时候挑战实体AI和机器人技术将成为就业杀手的错误观念了。 提升技能、重新培训、加强安全和提高生产力应是关注的重点领域。 2022年ChatGPT的发布让GenAI进入了公众视野。
2/8/2025 4:54:19 PM
Omar Asali
IBM发布视觉语言模型Granite-Vision-3.1-2B,轻松解析复杂文档
随着人工智能技术的不断发展,视觉与文本数据的融合成为了一项复杂的挑战。 传统的模型往往难以准确解析表格、图表、信息图和图示等结构化视觉文档,这一限制影响了自动内容提取和理解能力,进而影响了数据分析、信息检索和决策等应用。 面对这一需求,IBM 近期发布了 Granite-Vision-3.1-2B,一款专为文档理解设计的小型视觉语言模型。
2/8/2025 4:45:00 PM
AI在线
前 OpenAI 首席科学家苏茨克维的新 AI 公司 SSI 估值飙升:消息称达 200 亿美元
SSI 目前尚无收入,公司目标是开发“安全的超级智能”,即智能水平超越人类、但依然符合人类利益的 AI。
2/8/2025 4:36:16 PM
清源
昆仑万维天工AI上线DeepSeek R1 + 联网搜索功能,提升智能体验
2月8日,昆仑万维旗下的天工 AI 正式发布了 PC 版的重大更新,推出了 “DeepSeek R1 联网搜索” 功能。 这一新功能不仅解决了用户长期以来对 DeepSeek 联网功能无法使用的问题,还优化了 R1版本在使用过程中的崩溃情况,为用户带来了更为稳定、高效的智能体验。 自2025年1月下旬发布以来,DeepSeek R1模型在全球 AI 领域引起了广泛关注。
2/8/2025 4:23:00 PM
AI在线
中国移动云盘接入 DeepSeek 模型,实现深度思考及快速回答
中国移动云盘今日宣布正式接入 DeepSeek-R1 大模型,无需等待、无需更新云盘 App,只需进入 AI 助手即可轻松开启全新智能服务。
2/8/2025 4:22:15 PM
浩渺
明星造车公司破产在即:巅峰市值2000亿,创始人因诈骗锒铛入狱
杰西卡 发自 副驾寺. 智能车参考 | 公众号 AI4Auto又一家电车明星,来到了破产边缘。 号称“氢版特斯拉”的Nikola——尼古拉,靠着和特斯拉一样宏大的愿景,一步步走上巅峰——.
2/8/2025 4:13:45 PM
杰西卡
昆仑万维天工AI上线DeepSeek R1+联网搜索功能
2月8日,昆仑万维集团旗下的天工AI正式上线了“DeepSeek R1 联网搜索”功能,为用户带来了一次重大更新。 这一升级不仅解决了DeepSeek联网功能无法使用的问题,还优化了R1版本偶尔崩溃的困扰,极大地提升了AI的稳定性和用户体验。 自2025年1月下旬发布以来,DeepSeek R1模型迅速在全球AI领域引起关注。
2/8/2025 4:13:00 PM
AI在线