资讯列表
经网络的每一层都是干嘛的?这才是神经网络结构的核心
组成一个神经网络从技术上来说主要有以下几个部分:数据集神经网络结构损失函数优化函数反向传播而不同神经网络模型之间最主要的区别就是神经网络结构的异同,当然最相似的地方也是神经网络结构。 原因就在于神经网络结构是由多个神经网络层所组成的;而使用不同的层就实现了不同功能的神经网络模型。 神经网络的层一个神经网络是由多种神经网络层所组成的,而每个神经网络层实现不同的功能;然后由此组成神经网络模型。
3/5/2025 8:00:00 AM
AI探索时代
全面增强LLM推理/规划/执行力!北航提出全新「内置CoT」思考方法
用户已经习惯于将大模型如ChatGPT、Llama-3-chat等当作聊天对象,然而在用户和聊天助手的会话中,有的用户提示(例如一些命令或请求)不能在一轮会话中结束,需要大语言模型和用户进行多轮会话。 这种跨越多轮的会话目前仍然存在一些问题:大语言模型的回答容易出错,不能帮助用户达到目标,且随着会话轮数增加出错概率会增大。 对同一个命令或问题,大语言模型比较难以根据实际需求产生不同流程的响应,在需要大语言模型与环境交互时,目前比较流行的做法是使用函数调用或工具调用,但不够优雅和高效,而且由于上下文窗口的限制,能支持的工具调用数量有限。
3/5/2025 4:00:00 AM
新智元
如何高效使用DeepSeek-R1:推理大模型调优指南
如何高效使用DeepSeek-R1:推理大模型提示工程调优指南LLM 中 DeepSeek-R1 与传统非推理模型的交互方式存在本质差异。 在数学推导、代码生成等复杂任务中展现出色能力。 但与通用大模型不同,推理型模型需要特殊的交互策略,博文内容列举几个常见的优化手段,帮助开发者构建高效的交互范式。
3/5/2025 3:00:00 AM
山河已无恙
强到离谱!如何用DeepSeek快速搞定3D建模+PPT+短视频?
在设计领域,效率与创意是永恒的追求。 随着 AI 技术的迅猛发展,Deepseek 等 AI 工具为设计师带来了前所未有的创作体验。 今天,就来看看 Deepseek 与其他 AI 产品强强联合,如何打破传统设计的边界,解锁无限可能。
3/5/2025 1:00:35 AM
团队58UXD
彻底理解推理模型和通用模型
以下是通用模型和推理模型的核心总结及其区别,通过表格和关键点快速对比。 一、概念1、通用模型(General-Purpose Models)定义:能够处理多种任务的模型,如文本生成、问答、翻译、摘要等,通常基于大规模预训练(如GPT系列、PaLM等)。 特点:a.广泛适用性:通过海量数据预训练,学习通用语言模式和知识。
3/5/2025 12:22:00 AM
独行者木子李
如何做好对话式AI的交互设计?高手总结了6个章节!
对话式人工智能技术正在彻底改变我们访问信息的方式,它通过提供定制化和直观的搜索体验,不仅满足了用户的需求,还为企业带来了新的力量。 一个设计精良的对话AI就像一个充满智慧的顾问,能够深刻理解用户的意图,并在庞大的数据集中轻松导航,这样的能力显著提高了用户的幸福感和参与度,建立了牢固的忠诚度和信任关系。 与此同时,企业也享受到了效率的提升、成本的节约和利润的增加。
3/5/2025 12:01:38 AM
团队iFlytek STC UXD
智谱开源AI绘图CogView4,曾经的开源之光回来了!
智谱开源 AI 绘图 CogView4,曾经的开源之光回来了。 昨天连更两篇,今天想休息一下,结果。 真的快肝吐了,感觉自从 DeepSeek 开源统治地球之后。
3/5/2025 12:01:33 AM
数字生命卡兹克
B站文生视频模型工程实践
一、前言近年来,AI 内容生成(AIGC)领域的快速发展令人雀跃,OpenAI 在 2023 年初推出大型语言模型(LLM)GPT-4 受到了学术界和工业界的极大关注。 OpenAI 随后在 2024 年初推出文生视频(T2V)模型Sora,能够根据文本指令制作出具有现实风格和富有想象力的场景视频,更是展示了令人惊喜的“世界模拟器”能力。 B站作为UGC内容丰富的视频网站,在视频生成模型领域有着天然数据优势和广泛应用场景。
3/5/2025 12:00:55 AM
AI
耗资十亿日元开发,日本儿童虐待检测 AI 系统项目宣告失败
近年来,随着人工智能(AI)技术的快速发展,日本企业和部分政府部门纷纷涉足这一领域,试图通过技术手段提升效率、解决人手短缺等问题。然而,该国一项旨在保护儿童免受虐待的人工智能系统项目却因技术缺陷而宣告失败。
3/4/2025 11:02:38 PM
远洋
OpenAI 携手十余所顶尖大学启动 NextGenAI 联盟,豪掷 5000 万美元推动教育变革
北京时间今晚,OpenAI宣布启动NextGenAI项目,这是一项由15个顶尖研究机构组成的创新联盟,旨在利用人工智能推动科研突破和教育的变革。
3/4/2025 10:21:06 PM
清源
德国电信“运营商定制 AI 手机”亮相:深度集成 Perplexity,动口即可操作
德国电信在 MWC 2025 上公布了 AI Phone 的更多细节。这款设备去年 MWC 期间首次以概念机形式亮相,目前该机确认由 Perplexity AI 提供支持,计划今年下半年正式发布,并于 2026 年进入欧洲主要市场。
3/4/2025 9:06:49 PM
清源
亚马逊:公司几乎没有业务部门不受 AI 影响,我们有约 75 万台机器人
“我们现在约有 75 万台机器人,负责从拣选物品到自主运行等各种任务。Alexa 可能是全球最普及的家用 AI 产品……可以说,生成式 AI 已渗透到亚马逊的每个业务领域。”
3/4/2025 8:05:05 PM
清源
华为杨超斌:近 8 个月,国内 AI 大模型 Token 所带来的流量增长了 33 倍
杨超斌预计,到2030年,中国市场因为Token带来的网络流量的增加,将会达到每天500TB左右,而现在全中国所有的移动网络流量加起来每天是90TB。这意味着单就Token的数量就可以带来移动网络流量的增长。
3/4/2025 7:47:31 PM
清源
算能推出 SRA3-40:全球首款支持 DeepSeek 的 RISC-V 众核服务器
SRA3-40 属于计算服务器范畴,基于算能旗下算丰团队开发的新一代服务器级 64 核心 RISC-V 处理器 SG2044。
3/4/2025 7:19:36 PM
溯波(实习)
谷歌研究员、作家在 MWC 2025 激辩 AI 未来:推动生活进步 or 加剧社会裂痕
当地时间周一,MWC 2025 大会上的一次对话,展示了 AI 的两种截然不同的愿景。
3/4/2025 6:50:54 PM
清源
用于临床工作流程的新AI助手,微软推出Microsoft Dragon Copilot
编辑 | 白菜叶在 HIMSS 2025 上,微软团队宣布推出了 Microsoft Dragon Copilot,这是一款全新的语音解决方案,可改变临床医生的工作方式。 自 2022 年以近 200 亿美元收购临床文档公司 Nuance 以来,微软稳步将该业务打造为一套临床辅助工具,其中包括使用语音识别软件记录患者信息的 Dragon Medical One,以及人工智能支持的临床助理 DAX Copilot,这是一款人工智能支持的临床助理和决策支持工具。 Dragon Copilot 在这些技术的基础上进一步简化了文档编制、显示信息并自动执行了整个护理环境中的任务。
3/4/2025 6:42:00 PM
ScienceAI
谷歌客场作战和“苹果牌 AI”抢客户:iPhone 版 Gemini 上线锁屏小组件,主要功能一步直达
用户可通过这些快捷方式直接打开应用和键盘,方便立即输入提示。
3/4/2025 6:27:21 PM
清源
生物版DeepSeek的隐秘竞争,中国模型被视为更强对手,赛诺菲10亿美金押宝!
编辑 | ScienceAI上周,美国斯坦福大学、英伟达等机构联合发布的生物学AI模型Evo2引起广泛关注,被誉为「生物版Deepseek」。 正当全球科研人员为这一突破性成果热议时,该论文中的特殊标注揭开了中国AI的实力——来自中国公司百图生科xTrimo系列大模型,被Evo2的研究人员列为「参数规模更大但尚未开源的竞争对手」,揭示中国生物大模型的崛起。 实际上,百图生科公司一直被美国市场认定为生命科学基础大模型的先行者,自2020年起一直前瞻性地在该领域布局。
3/4/2025 6:22:00 PM
ScienceAI