理论
机器学习特征工程的最佳实践
特征工程是模型训练之前运行的关键过程,因为输入数据的质量直接决定了模型输出的质量。 虽然深度学习模型擅长从图像或文本等非结构化数据中自动学习特征,但明确的特征工程对于表格数据集仍然至关重要。 在本文中,云朵君将展示特征工程对回归任务的影响,特别关注具有混合数字、分类和基于时间的特征的大型表格数据集。
7/31/2025 1:22:00 AM
云朵君
ChatGPT「学习模式」火爆上线,一大波教育AI连夜被端!24小时导师免费用
刚刚,OpenAI迎来一个全新功能更新,但不是GPT-5。 ChatGPT上线了一个新模式——Study and Learn(学习模式)! 使用这种模式,ChatGPT不仅仅提供答案,而是逐步引导解决问题。
7/31/2025 1:15:00 AM
现代LLM架构设计一览:从DeepSeek-V3到Kimi K2
主要内容现代LLM架构的演进主要围绕以下几个核心目标:提高推理效率:通过GQA、MLA、滑动窗口注意力、MoE等技术减少内存占用和计算量。 增强训练稳定性:通过归一化层(如RMSNorm)的放置和QK-Norm等技术优化训练过程。 优化模型容量与性能:通过MoE实现更大参数量和知识吸收能力,同时保持推理效率。
7/31/2025 1:00:00 AM
常华Andy
高水准的开发:能用AI解决的问题,绝不自己动手去写
对于开发人员和软件测试人员来说,最重要的是有一款量身定制的接口调试工具,可以让开发和测试工作事半功倍。 Apipost是AI驱动的集API设计、调试、文档生成、自动化测试、性能测试于一体的API开发协作管理平台,功能全面,尤其适合注重团队协作和轻量体验的用户。 图片一、Apipost核心优势无需登录,离线可用:Apipost无需账号登录,支持离线调试,保护用户隐私,提升效率;高效的AI智能开发助手:集成AI大模型,解决接口开发测试过程中命名难题、手动维护文档繁琐等痛点问题,实现API设计、调试、文档生成和自动化测试的闭环高效开发管理;超轻量设计:资源占用少,加载迅速,适合对性能敏感的用户;100%兼容Postman脚本语法:用户可以无缝迁移现有Postman脚本,降低学习成本。
7/31/2025 12:00:05 AM
告别大统一模型!预填充解码分离背后的技术哲学革命
说实话,最近看到一个技术思路的时候,我有点被震撼到了。 我们一直觉得,既然大语言模型这么厉害,那就应该用一个统一的大模型来处理所有事情——输入理解、上下文处理、token生成,全都交给一个模型搞定。 这听起来很符合"大力出奇迹"的思路。
7/31/2025 12:00:00 AM
阿丸笔记
十年磨剑:云势数据以 AI 重构全球客户服务生态
某汽车客户通过云势数据 ConnectNow 电话机器人客户服务系统,引导终端用户处理设备故障问题。 该系统可以支持 10 种语言,语音识别和故障信息录入准确率超过 90%,每年省 550 万元。 这个案例数字的背后,是云势数据与亚马逊云科技合作,十年技术沉淀的爆发。
7/30/2025 5:52:19 PM
鸢玮
逆天!旧Mac上能run千亿参数SOTA!效果惊人:一次生成游戏,0修改!本地大模型拐点来了!网友:别被大模型叙事带偏了(附指南)
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)起猛了,连老电脑都能跑智谱家新一代的 SOTA 模型了! 一篇来自技术人 Simon Willison(Python 知名 Web 框架 Django 的共同创始人)的实测文章,在 Hacker News 上引发热议:“我 2.5 年高龄的旧笔记本,现在不仅能在本地跑千亿参数模型,甚至还能用它写出一款完整的 JavaScript 太空入侵者游戏。 ”图片 这个模型,正是昨天新鲜出炉的 GLM-4.5 系列。
7/30/2025 2:11:55 PM
伊风
全球首次,「AI记忆」开源落地!MIRIX同步上线APP
还记得第一次用 GPT 写邮件的惊喜吗? 却也一定遇到过今天的 AI「忘性」——聊得再深入,窗口一关,历史烟消云散。 因此,研究人员认为:从「对话」到「记忆」,将是AI进化的必经之路。
7/30/2025 9:15:00 AM
科学能力太强,这个多模态推理「六边形战士」被严重低估!Intern-S1开源登顶
在人声鼎沸的WAIC 2025上,一款堪称「全能高手 科学明星」合体的大模型,由于在科学方面太优秀,反倒显得低调——但它的能力却无法被忽视。 它能精准解析分子结构、看懂地震波图、推演化学反应路径……7月26日,上海人工智能实验室(上海AI实验室)发布并开源「书生」科学多模态大模型Intern-S1。 它不仅多模态能力全球开源第一,文本能力比肩国内外一流模型,科学能力全模态达到国际领先。
7/30/2025 9:05:00 AM
狂拿大模型明星订单,一家清华系HPC-AI Infra公司浮出水面
不靠囤算力,拿下数家大模型明星公司订单。 93年创始人掌舵的清华系计算创业公司,有点出其不意。 2023上半年,百模大战开启,模型预训练需求空前爆发,在算力焦虑下,囤积算力成为一种趋同性动作,更充裕的算力几乎就等于金额更高的订单。
7/30/2025 8:47:00 AM
每个人的AI科学助手!全球首个通用科学智能体来了,全网资源+1.7亿学术文献让科研效率狂飙
全球首个通用科学智能体,亮相WAIC! 就在这届WAIC的未来发展论坛上,上海交大青年博导、CVPR满分论文得主张林峰,深势科技创始人张林峰,与上海交大陈思衡,共同发布了全球首个通用科研智能体SciMaster。 SciMaster是属于每个人的专家级科研助手,可以结合全网资源和1.7亿科学文献,帮你扫清科研过程中遇到的各种困难。
7/30/2025 8:45:00 AM
AI和云基础设施初创企业E2B如何成为88%的财富100强企业的必备选择
专为智能体设计云基础设施的初创公司E2B,已完成由Insight Partners领投的2100万美元A轮融资,借势企业对AI自动化工具需求的激增。 据该公司透露,目前已有88%的《财富》100强企业签约使用E2B平台,这凸显了企业对智能体技术的迅速采纳。 本轮融资吸引了现有投资者Decibel、Sunflower Capital和Kaya的参与,以及包括Docker的前CEO Scott Johnston在内的知名天使投资人的加入。
7/30/2025 7:20:00 AM
Michael
大模型中的嵌入向量
前面文章和小伙伴们聊了 Tokenizer,经过 Tokenizer 之后,自然语言变为 Token,那么大模型就可以直接训练 Token 了嘛? 还不行! 接下来还有一个词嵌入的环境,英文就是 Embedding,Embedding 实际上就是将 Token 转为张量,在有的场景下,Embedding 也指张量本身。
7/30/2025 4:15:00 AM
江南一点雨
数据才是AI的真正护城河啊!
一位做AI创业的朋友跟我抱怨:"模型架构都差不多,算力也能买到,为什么我们的模型就是比不过大厂? " 我问他:"你们用什么数据训练的? " 他说:"Common Crawl啊,大家不都用这个吗?
7/30/2025 4:00:00 AM
大数据AI智能圈
30万岗位将被AI吞噬?印度2830亿美元软件业迎来「清算时刻」!
AI裁员潮来袭,印度引以为傲的软件产业正面临一个严峻的「清算时刻」。 人工智能引发的行业重塑,或将导致印度IT业面临10万至30万人的裁员潮! 对于印度的IT公司而言,刚刚过去的是一个令人失望的财报季。
7/30/2025 3:55:00 AM
OKR框架在人工智能和数字化转型中的应用
一、OKR框架概述定义:目标与关键成果(OKR)是一个目标设定框架,旨在帮助组织定义和跟踪目标(即要实现的目标)及其相关关键成果(即衡量进度的方法)。 OKR起源于英特尔,后因谷歌和约翰·杜尔的著作《衡量重要的事情》而广为推广。 OKR通常设定在不同的层级,包括公司、团队、个人,并且通常每季度进行一次。
7/30/2025 2:00:00 AM
晓晓
TTD-DR:基于测试时(Test-Time)扩散的深度研究Agent突破
谷歌在扩散技术领域持续发力。 这次,他们将扩散技术应用于深度研究agent,专门用于优化研究报告生成过程。 该方法在长篇研究任务中对比OpenAI Deep Research取得了69.1%的胜率。
7/30/2025 2:00:00 AM
无影寺
领导者的认知跃迁:MLPO如何通过多智能体训练实现能力突破
大家好,我是肆〇柒。 大语言模型(LLM)在翻译、问答等任务中展现了卓越能力,但其在事实准确性与复杂推理上仍存在显著缺陷。 为弥补这一短板,多智能体(Multi-Agent)范式被研究者提出:通过多个LLM协同工作(如辩论、验证、纠错),利用集体智慧超越单一模型的局限。
7/30/2025 1:00:00 AM
肆零柒
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉