理论
突发!OpenAI免费开放Deep research,超强AI Agent
今天凌晨4点30,OpenAI推出轻量级版本的Deep research功能提高当前的速率限制,以扩大Plus、Team和Pro用户的使用范围。 值得一提的是,从今天开始免费ChatGPT用户可以使用Deep research,并且支持最新的o4-mini模型。 下面「AIGC开放社区」就用免费版为大家展示一下Deep research的免费功能。
4/25/2025 9:09:00 AM
AIGC开放社区
从模型原理到代码实践,深入浅出上手 Transformer,叩开大模型世界的大门
作者 | Plus一、序言作为非算法同学,最近被Cursor、DeepSeek搞的有点焦虑,同时也非常好奇这里的原理,所以花了大量业余时间自学了Transformer并做了完整的工程实践。 希望自己心得和理解可以帮到大家~如有错漏,欢迎指出~本文都会以用Transformer做中英翻译的具体实例进行阐述。 二、从宏观逻辑看Transformer让我们先从宏观角度解释一下这个架构。
4/25/2025 9:00:00 AM
腾讯技术工程
微软重磅官宣:「AI智能体」同事连夜上线!预言25年人类同事成稀有物种
就在刚刚,微软宣布:AI同事真来了! CEO纳德拉亲自种草,激动表示:今天,对Microsoft 365 Copilot来说是个大日子。 Copilot的界面,已经完全AI化。
4/25/2025 8:55:00 AM
新智元
DeepResearch轻量版今日面向免费用户开放,实测一波,秒生成,太快了!
刚刚3个小时前,OpenAI推出轻量级版本的Deep research功能提高当前的速率限制,以扩大Plus、Team和Pro用户的使用范围。 值得一提的是,从今天开始免费ChatGPT用户可以使用DeepResearch,并且支持最新的o4-mini模型。 我这里实测了一下,中美两国人形机器人的市场现状和趋势分析,要求生成一份深度分析报告。
4/25/2025 8:44:04 AM
AI语音革命新纪元:Sesame模型让聊天AI“活”出表情包式情绪声线
译者 | 朱先忠审校 | 重楼Sesame使用一种名为残差向量量化的深度学习技术对语音进行编码最近,Sesame人工智能公司发布了他们最新的语音转语音(Speech-to-Speech)模型的演示。 这是一个非常擅长说话的对话式人工智能代理,它们能够提供相关的答案,并带有表情地说话,而且说实话,它们非常有趣,互动性很强。 请注意,有关这方面的系统的技术论文尚未发布,但他们确实发布了一篇简短的博客文章,并提供了有关他们使用的技术和他们所构建的先前算法的大量信息。
4/25/2025 8:19:05 AM
朱先忠
企业中最常用的十种GenAI工具
从AI聊天机器人和虚拟助手,到音频和视频生成器,这些都是当今最前沿的GenAI工具。 自OpenAI于2022年推出ChatGPT以来,GenAI已大规模进入企业领域。 根据Precedence Research的数据,2024年全球GenAI市场规模已超过250亿美元,并预计到2033年将达到惊人的8030亿美元。
4/25/2025 7:10:00 AM
Thor Olavsrud
CISO仍未遏制影子AI飙升的数据风险
GenAI带来了诸多益处,但同时也伴随着数据安全风险,这主要通过影子AI的使用和敏感信息的泄露来实现。 在企业中,这些风险正在加剧,因为员工经常使用私人GenAI账户来处理敏感数据。 根据Netskope的一项研究,尽管大多数企业(90%)都提供了官方批准的GenAI应用,甚至更多(98%)的企业为用户提供了包含AI功能的应用,但企业中未经授权的AI服务使用仍在激增。
4/25/2025 7:05:00 AM
John
机械臂+大模型+多模态:打造人机协作具身智能体
在人工智能快速发展的浪潮中,多模态大模型已成为技术前沿,使AI能够同时理解文本、图像、音频等多种信息。 这一突破为具身智能体开辟了新天地。 最近我在github中就找到了一个这样好玩的项目vlm_arm,其将机械臂与多模态大模型结合,打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。
4/25/2025 2:30:00 AM
贝塔街的万事屋
基于MiniO存储的RAGFlow+Dify图片处理方案
上篇文章中介绍了如何基于 RAGFlow 知识库,通过 Dify 的 HTTP 请求获取映射 Code 节点替换,将占位符解析为最终的 img 标签,来稳定的实现问答中图片正常显示问题。 Dify RAGFLow:基于占位符的图片问答升级方案(最佳实践)其中的"占位符"和"实际图片访问 URL"映射关系的存储使用了阿里云的 OSS 存储服务。 初期选择阿里云 OSS 作为存储,主要是方便大家快速验证和迭代 RAG 应用的核心逻辑,避免过早陷入基础设施的维护细节。
4/25/2025 1:30:00 AM
韦东东
智能体的五大商业用例
AI的下一代已经到来,它具有自主性。 智能体与聊天机器人由相同的AI系统提供支持,但可以独立行动、协作以实现更大的目标,并接管整个业务流程,这项技术相对较新,但所有主要参与者都已经加入。 去年10月,微软宣布包括标准银行、路透社、Virgin Money和苏黎世保险在内的10万家组织正在使用Copilot .
4/25/2025 1:10:00 AM
Maria
DeepSeek在数据领域的30个应用场景
在这个数据AI的时代,DeepSeek作为新一代AI模型正在改变我们处理、分析和理解数据的方式。 本文为您揭秘DeepSeek在数据领域的30个颠覆性应用场景,带大家一窥AI如何重塑数据价值链。 一、数据获取与处理篇1.
4/25/2025 12:50:00 AM
大数据AI智能圈
揭秘大模型的魔法:训练你的tokenizer
大家好,我是写代码的中年人。 在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代,“Tokenizer(分词器)”这个词频频出现在开发者和研究者的视野中。 它是连接自然语言与神经网络之间的一座桥梁,是大模型运行逻辑中至关重要的一环。
4/25/2025 12:20:00 AM
写代码的中年人
Windsurf全面降价!编程赛道的价格战要来了;被OpenAI收购尚未证实
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)刚刚得到消息,AI编码助手初创公司 Windsurf周一宣布“全面”降价,称随着与竞争对手 Cursor 的竞争加剧,用户可以“大幅节省成本”。 Windsurf 表示,它将放弃其复杂的“流程操作积分”系统,该系统会向开发者收取其 AI 在后台执行的操作的费用。 此外,该公司还将team plans的价格从每位用户每月 35 美元降至 30 美元,同时其企业计划的价格也将“大幅降低”。
4/24/2025 6:40:17 PM
云昭
谷歌“Wi-Fi密码”式的最瘦大模型
Gemma 3 的“低门槛 AI”计划露面了,谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码,其实却是谷歌迄今为止最精简的大模型是的,不再只属于高端服务器和土豪显卡,普通玩家的游戏卡,甚至手机,都能一试身手。 这波操作的核心是三个字:量化训练(Quantization-Aware Training, QAT)。
4/24/2025 2:13:00 PM
文摘菌
大模型向量去重的N种解决方案!
简单来说,“向量”Vector 是大模型(LLM)在搜索时使用的一种“技术手段”,通过向量比对,大模型能找出问题的相关答案,并且进行智能回答。 向量简介Vector 是向量或矢量的意思,向量是数学里的概念,而矢量是物理里的概念,但二者描述的是同一件事。 “定义:向量是用于表示具有大小和方向的量。
4/24/2025 11:09:13 AM
磊哥
刚刚,OpenAI最强图像生成API上线,一张图1毛5!
昨夜,OpenAI发布全新图像生成模型gpt-image-1,API向所有开发者开放。 这一次,他们直接把每张图的成本打到几美分。 图片对于低、中、高质量的方形图像,生成大约花费0.02美元、0.07美元、0.19美元。
4/24/2025 10:31:54 AM
LLM 推理引擎之争:Ollama or vLLM ?
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型推理框架。 在人工智能领域,模型的推理能力是衡量其性能的核心指标之一,直接影响其在复杂任务中的表现。 随着自然语言处理(NLP)和大规模语言模型(LLM)技术的迅猛发展,众多创新模型不断涌现,为开发者提供了多样化的选择。
4/24/2025 10:26:40 AM
Luga Lee
SLAM3R:北大陈宝权团队等只用单目长视频就能实时重建高质量的三维稠密点云
北京大学陈宝权团队和香港大学等高校及业界机构联合推出实时三维重建系统 SLAM3R,首次实现从长视频(单目 RGB 序列)中实时且高质量地重建场景的稠密点云。 SLAM3R 使用消费级显卡(如 4090D)即可达到 20 FPS 的性能,重建点云的准确度和完整度达到当前最先进水平,同时兼顾了运行效率和重建质量。 该研究成果被 CVPR 2025 接收为 Highlight 论文,并在第四届中国三维视觉大会(China3DV 2025)上被评选为年度最佳论文,合作者为董思言博士(共同一作)、王书哲博士、尹英达博士、杨言超助理教授和樊庆楠博士,第一作者为北京大学本科生刘宇政。
4/24/2025 9:44:05 AM
机器之心
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
Gemini
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
DeepMind
特斯拉