理论
OpenAI全新智能体评估报告:Operator在软件测试中表现如何?
译者 | 核子可乐审校 | 重楼OpenAI发布全新AI智能体Operator,本文带你一探如何用它简化软件测试、减少工作量并提高准确性。 测试是项既关键、又相当繁杂的过程。 保障每项功能、每个流程和每种极端情况都能按预期运作往往要占用大量时间和人力。
2/13/2025 9:09:58 AM
核子可乐
推荐一个企业级知识图谱增强的检索增强生成(RAG)的项目
介绍Microsoft GraphRAG 是一个开源项目,旨在利用 Microsoft Graph 的强大功能构建企业级的知识图谱增强的检索增强生成(RAG)方案。 简单来说,它将企业内部的各种数据源(如邮件、文档、日历、联系人等)通过 Microsoft Graph 连接起来,形成一个结构化的知识图谱,然后利用这个知识图谱来增强 RAG 系统的检索能力,从而提升大语言模型(LLM)在企业应用中的问答和生成效果。 项目架构GraphRAG 的架构设计清晰且模块化,主要包含以下几个核心组件:(1) 数据连接器(Data Connectors):负责从各种企业数据源(如 Microsoft 365 服务,包括 Exchange Online、SharePoint Online、OneDrive、Teams 等)提取数据。
2/13/2025 9:01:03 AM
IT运维技术圈
DeepSeek-R1技术解码:如何实现大模型推理能力的提升?
1月20日,幻方量化旗下AI公司深度求索(DeepSeek)发布了新一代开源大模型DeepSeek-R1。 作为一款专注于推理能力的AI大模型,DeepSeek-R1凭借着成本低、推理能力强等优势,在人工智能领域掀起了千层巨浪,引起了人们的广泛关注与讨论。 DeepSeek-R1的成功,让我们更加清晰地认识到推理能力在当下人工智能发展中的重要地位。
2/13/2025 8:51:23 AM
Yu
NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略
本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。 首先介绍了 NLLB-200 的背景、数据、分词器和模型,以及其与 LLM(Large Language Model)的异同和协同关系。 接着列举了实战与应用的案例,包括使用 ChatGPT 生成的样本微调 NLLB-200 和使用 NLLB-200 的翻译结果作为 LLM 的 prompt 等。
2/13/2025 8:44:56 AM
Huang Minghui
干货:DeepSeek+SpringAI实现流式对话!
前一篇文章我们实现了《SpringAI集成满血版DeepSeek》,但是大模型的响应速度通常是很慢的,为了避免用户用户能够耐心等待输出的结果,我们通常会使用流式输出一点点将结果输出给用户。 那么问题来了,想要实现流式结果输出,后端和前端要如何配合? 后端要使用什么技术实现流式输出呢?
2/13/2025 8:06:40 AM
磊哥
DeepSeek 会是个好DBA吗?
作为近期作为大火的 AI 产品,Deepseek(简称DS) 已经成为现象级的爆款,朋友圈几乎都被刷屏,大家都在探索将 DS 深入千行百业,看如何能发挥出更大价值。 作为数据库从业者,我也在思考这个问题,看 DS 能做点啥。 圈里已经有几位朋友做了分享,我将从使用者的角度来谈谈对 DS 的使用印象。
2/13/2025 7:36:41 AM
韩锋
几个免费使用 DeepSeek 的渠道,告别「服务器繁忙,请稍后再试」
在眼下这个时间点,AI 已经不是什么稀缺资源了,这当然和最近爆火的 DeepSeek 有很大关系,尤其春节那几天,无论是北上广还是小县城甚至农村,无论是985高材生还是村里的叔叔大爷,都用上了 AI 大模型,而且是能力排在第一梯队的大模型,也就是 DeepSeek-R1。 之所以说在这以前,AI 还是稀缺资源,那是因为公认的第一梯队的大模型产品基本上都是国外的,而想要使用国外的产品,对于普通人来说,门槛还是非常高的。 而国内虽然也有不少免费的产品,但是整体来说,还是差点意思的。
2/13/2025 12:10:00 AM
风筝
神奇!DeepSeek一键接入WPS和Office,效率提升300%,无需任何编程(附保姆级教程)
大家好,我是岳哥。 DeepSeek最近爆火,各种玩法层出不穷,但跟咱们工作相关的除了一些AI指令,似乎没有其它新的玩法。 但我们工作中有大量需要使用Office或WPS等办公软件,那有没有什么办法在上面集成DeepSeek呢?
2/13/2025 12:00:02 AM
丶平凡世界
轻量开源!微软基础模型LLaVA-Rad:自动生成高质量放射学报告
编辑丨coisini多模态生成式人工智能的最新进展已将生物医学应用扩展到同时处理文本和图像,在视觉问答和放射学报告生成等任务中展现出潜力。 然而,这些模型在临床实现中面临挑战,特别是大型模型在计算成本等方面带来了部署难题。 小型多模态模型(SMM)虽然更高效,但与大型模型相比仍存在显著性能差距。
2/12/2025 5:42:00 PM
ScienceAI
DeepSeek爆火!我们整理了80余页宝典,带你从入门到精通!文末免费领取
出品 | 51CTO技术栈(微信号:blog51cto)新年伊始,DeepSeek的爆火席卷了全球。 更为难得地是,这款十分优秀的模型变得人人可以免费拥有。 在生成式AI大行其道的今天,DeepSeek正在凭借其开源、高效、多场景适应等优势,成为开发者、行业从业者以及个人用户的必备利器。
2/12/2025 4:13:34 PM
如何利用 DeepSeek-R1 本地部署强大的推理模型:从 ChatGPT 风格界面到 API 集成
01、概述随着开源推理模型如 DeepSeek-R1 的崛起,开发者可以在本地运行强大的 AI,而不再依赖于云服务。 这一技术的出现引发了不小的网络热议,或许你也在好奇如何利用这一模型在本地搭建自己的 AI 系统。 本指南将带你了解两种关键的使用场景:普通用户:创建一个 ChatGPT 风格的界面开发者:通过 API 集成模型到应用中在开始之前,如果你有兴趣深入了解 DeepSeek-R1 的背景,以便更好地理解接下来的过程,可以参考我的文章《DeepSeek-R1 理论简介(适合初学者)》。
2/12/2025 2:09:31 PM
基咯咯
AMD开源科研AI Agent,一站式自动写论文
科学研究的漫长历程中,受限于时间和资源,许多高质量的研究想法未能得到充分探索。 如果能够减少探索想法的限制,研究人员将能够同时研究多个概念,增加科学发现的效率。 所以,为了帮助科研人员节省时间快速撰写论文,AMD和约翰·霍普金斯大学的研究人员联合开源了一个专用于科研的AI Agent——Agent Laboratory。
2/12/2025 1:44:12 PM
AIGC开放社区
DeepSeek并非完美,训练过程存在“深度诅咒”
高性能大模型在训练的过程中通常需要数千个GPU,耗费数月甚至更长时间才能完成一次训练。 这种巨大的资源投入使得模型的每一层都必须高效训练,才能确保算力资源最大化利用。 但大连理工、西湖大学、牛津大学等研究人员对DeepSeek、Qwen、Llama和Mistral研究发现,这些模型的深层在训练过程中表现并不好,甚至可以被完全剪枝而不会影响模型性能。
2/12/2025 1:42:25 PM
AIGC开放社区
AI太强,验证码全失效?新南威尔士全新设计:GPT傻傻认不出,人类一致好评
验证码通过利用人类与机器的认知差异实现身份验证。 传统的验证码方案主要依赖文本扭曲[1]、图像分类[2,3]或逻辑推理[4]来区分人类与机器,但随着多模态LLMs(Large Language Model)的发展[5],这些方法逐渐失效,机器也能达到人类水平的认知。 GPT-4o对简单「文本验证码」的破解成功率超过90%,Gemini 1.5 Pro 2.0[6]能识别带噪声的「reCAPTCHA图像」(成功率50%);LLMs在「推理验证码」上的表现较差(平均成功率20%),但人类用户的失败率也同样很高。
2/12/2025 1:37:56 PM
新智元
如何训练最强代码大模型?北大aiXcoder-7B贡献前沿实践
本文的通讯作者是北京大学计算机学院长聘教授李戈。 本文一作是 aiXcoder 蒋思源和北大李戈教授课题组博士生李佳,团队重点关注融合深度学习与软件工程的代码建模方法。 如何训练一个代码大模型?
2/12/2025 1:34:40 PM
机器之心
统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA
在最近的一篇论文中,来自字节跳动、北京大学等机构的研究者提出了 Sa2VA。 市面上第一个结合 SAM-2 和 LLaVA-like 的视频多模态大模型,结合了 SAM-2 和 LLaVA 的优势,实现了时空细粒度的理解。 论文地址:: 地址:,研究者设计了一套统一的指令微调格式 (Instruction Tuning Pipeline),整合了五种不同的任务,超过 20 个数据集一起进行联合训练。
2/12/2025 1:31:33 PM
机器之心
淘宝卖DeepSeek安装包一月赚数十万???我们免费教你本地部署DeepSeek-R1
当看到这条消息时,机器之心编辑部陷入了集体沉默。 作为一个免费开源的模型,DeepSeek 竟能让倒卖商如此大赚特赚,也着实让人震惊。 而这也从侧面佐证了 DeepSeek 模型引发的本地部署热潮是多么汹涌。
2/12/2025 1:23:47 PM
机器之心
奥特曼公开回怼马斯克,OpenAI董事会成员:说要收购,没收到报价啊?
奥特曼马斯克互怼继续! 继两人因“收购OpenAI”在𝕏平台爆发口水大战后,OpenAI CEO奥特曼在随后的巴黎AI峰会上,对马斯克予以公开回击。 马斯克此举只是压制竞争的小伎俩,我希望他能通过打造更好的产品来竞争;可能他的一生都处于不安全状态,我为这个人感到难过…我不认为他是个快乐的人。
2/12/2025 1:17:25 PM
量子位
资讯热榜
量大管饱!我整理了10个好用到爆的即梦4.0进阶玩法
全球高校 “猎杀” AI作业!学生如何应对 “人类化” 挑战?
AI 数据版权新纪元:Real Simple Licensing 协议引发行业关注
ChatGPT能随便连MCP了!对话就能开发票、帮退款…奥特曼的野心毕露:将OpenAI打造成全能型平台!开发者:太危险了不敢用
OpenAI进军韩国市场,携手三星与SK海力士共建AI未来!
为什么 LangChain ReAct 机制值得关注 ?
幻觉成了AI的“癌症”,连OpenAI也治不了
数十亿人将用上免费AGI!OpenAI奥特曼高调断言:全球经济将迎来极度通缩!效率强如DeepSeek,全球AI也需百吉瓦能源!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型