大语言模型
Salesforce 首席执行官:大语言模型可能已接近技术上限,AI 的未来是智能体
他认为人工智能的未来在于自主代理(即俗称的“AI智能体”),而不是目前用于训练 ChatGPT 等聊天机器人的大型语言模型(LLM)。
11/25/2024 9:29:55 AM
清源
多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024
谁是在线购物领域最强大模型? 也有评测基准了。 基于真实在线购物数据,电商巨头亚马逊终于“亮剑”——联合香港科技大学、圣母大学构建了一个大规模、多任务评测基准Shopping MMLU,用以评估大语言模型在在线购物领域的能力与潜力。
11/20/2024 12:17:59 PM
Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
Nature 上的一项研究,全面驳斥了 LLM (大语言模型)具有类人推理能力的说法。研究者设定的「人类亲吻难题」把 7 个大模型彻底绕晕。最终研究者表示,与其说 LLM 是科学理论,不如说它们更接近工具,比如广义导数。
11/16/2024 6:21:58 PM
清源
谷歌Gemini咒骂学生凸显AI失控风险
随着AI技术的迅猛发展,大语言模型应用(例如谷歌的Gemini和OpenAI的ChatGPT)已逐渐融入日常生活,帮助人们完成作业、解答各种问题。 然而,最近的一起事件再次引发了对AI模型潜在风险的广泛关注。 Gemini咒骂学生去死近日,一位Reddit学生用户分享了一段与Google聊天机器人Gemini的对话,令人不寒而栗。
11/15/2024 1:09:41 PM
佚名
SMoA: 基于稀疏混合架构的大语言模型协同优化框架
在大语言模型(LLM)快速发展的背景下,研究者们越来越关注如何通过多代理系统来增强模型性能。 传统的多代理方法虽然避免了大规模再训练的需求,但仍面临着计算效率和思维多样性的挑战。 本文提出的稀疏代理混合(Sparse Mixture-of-Agents, SMoA)框架,通过借鉴稀疏专家混合(Sparse Mixture-of-Experts, SMoE)的设计理念,有效解决了这些问题。
11/13/2024 2:37:30 PM
佚名
三款出色的无代码LLM应用程序构建神器
译者 | 布加迪审校 | 重楼通过轻松地挑选和丢弃组件并连接组件来构建LLM应用程序,比如矢量存储区、web搜索、存储内容和自定义提示等组件。 许多商业人士和非技术人士向我询问如何在缺乏技术知识的情况下构建AI应用程序。 我总是告诉他们,市面上有许多非代码解决方案,它们易于使用,可以帮助他们为公司中的任何人构建原型并部署解决方案。
11/8/2024 9:53:01 AM
布加迪
借助LLM实现模型选择和试验自动化
译者 | 布加迪审校 | 重楼大语言模型(LLM)已成为一种工具,从回答问题到生成任务列表,它们在许多方面简化了我们的工作。 如今个人和企业已经使用LLM来帮助完成工作。 代码生成和评估最近已经成为许多商业产品提供的重要功能,以帮助开发人员处理代码。
11/7/2024 8:03:10 AM
布加迪
AI Agent智能代理如何快速变现
AI Agent,即人工智能代理,是一种能够感知环境、进行自主理解、决策和执行动作的智能实体。 它基于大语言模型,能够通过独立思考、调用工具来逐步完成给定目标的计算机程序。 AI Agent的核心在于其自主性和自适应性,在特定任务或领域中能够自主地进行学习和改进。
11/5/2024 4:47:27 PM
天涯咫尺TGH
重大突破!AI首次发现内存安全漏洞
近日,谷歌宣布其大语言模型(LLM)项目“Big Sleep”成功发现了一个SQLite数据库引擎中的内存安全漏洞,这是人工智能首次在真实软件中发现可利用的内存安全漏洞(且该漏洞无法通过传统的模糊测试检测到)。 AI首次发现内存安全漏洞谷歌的“Project Naptime”项目旨在评估LLM在进攻性安全研究方面的能力,后来该项目演变为“Big Sleep”,由谷歌Project Zero和DeepMind团队共同参与。 Big Sleep项目致力于探索AI在发现软件漏洞中的潜力,特别关注高危漏洞的检测与利用。
11/5/2024 2:48:57 PM
佚名
RAG新突破:块状注意力机制实现超低延迟检索增强
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
11/3/2024 1:31:00 PM
机器之心
北大对齐团队独家解读:OpenAI o1开启「后训练」时代强化学习新范式
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]
9/15/2024 1:41:00 PM
机器之心
讲座预约 | AI4S 的前世今生:大语言模型与提示学习在科技研发中的应用与潜力丨GAIR Live
尽管人工智能驱动科学研究(AI4S)是最近几年才逐步火热的一个话题,但在某些科研领域如生物信息学,早在上个世纪90年代,随着人类基因组计划的实施,生物信息学迎来了一个“数据大爆炸”的时代,从那时起,生物信息学领域研究者就开始尝试使用人工智能技术来助力科研工作,直至今天。 在过去几年中,大模型技术作为人工智能的一个重要分支,已经从理论研究的深奥殿堂走向了实践应用的广阔天地,从实验室的封闭空间走向了我们日常生活的各个角落。 在生物信息学、材料科学、药物发现等领域,大模型技术正在发挥着越来越重要的作用。
9/12/2024 9:25:00 AM
岑大师
华为云发布医疗健康解决方案,盘古大模型赋能五大医药健康场景
8 月 10 日,华为云医药健康 AI 高峰论坛在海南博鳌拉开帷幕。华为云副总裁(战略与产业发展部 总裁)黄瑾在会上表示,国家政策对生物医药持续加码,医药健康企业也纷纷增加科研创新投入,但与国际先进水平相比仍有差距,尤其是在创新药研发上。然而,国内人工智能的快速发展为医药健康提供了可以赶超的新契机。华为云副总裁(战略与产业发展部 总裁)黄瑾“华为云拥有全栈自主的 AI 创新能力,我们希望和医药健康行业的客户一起努力,打造出中国自己的享誉国际的医药品牌,一起为人类健康谋福祉,推动中国医药健康产业发展。” 黄瑾表示。A
8/12/2024 3:37:00 PM
新闻助手
华为云用盘古大模型重塑服务,ModelArts Studio全面升级
6 月 21 日,华为开发者大会 2024 在东莞召开。在大会现场,华为发布了 HarmonyOS Next、盘古大模型 5.0 等方面的最新进展,也介绍了一系列 AI 先进技术的应用案例。在活动中,华为云 CTO 张宇昕表示:“华为云基于盘古大模型的能力,重塑一系列的云服务,打造 AI Native 的云,助力千行万业智能化。” 据介绍,华为云将盘古大模型和华为在产品研发、数据治理、安全防护、业务运维等各个领域积累的数据和经验相结合,“跳了自己的降落伞”,应用在了华为云 CodeArts、DataArts、Met
6/21/2024 7:57:00 PM
新闻助手
答案抽取正确率达96.88%,xFinder断了大模型「作弊」的小心思
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]本文第一作者和通讯作者均来自上海算法创新研究院。其中,通讯作者李志宇博士毕业于中国人民大学计算机专业,并曾在阿里巴巴、小红书等互联网公司从事算法落地与研究工作,曾参与了包括千亿级商品知识图
6/17/2024 2:59:00 PM
机器之心
总结374篇相关工作,陶大程团队联合港大、UMD发布LLM知识蒸馏最新综述
大语言模型(Large Language Models, LLMs)在过去两年内迅速发展,涌现出一些现象级的模型和产品,如 GPT-4、Gemini、Claude 等,但大多数是闭源的。研究界目前能接触到的大部分开源 LLMs 与闭源 LLMs 存在较大差距,因此提升开源 LLMs 及其他小模型的能力以减小其与闭源大模型的差距成为了该领域的研究热点。LLM 的强大能力,特别是闭源 LLM,使得科研人员和工业界的从业者在训练自己的模型时都会利用到这些大模型的输出和知识。这一过程本质上是知识蒸馏(Knowledge,
3/18/2024 11:09:00 AM
机器之心
对话上交苏剑波教授:直面手语的「方言」多样性与系统「通用性」挑战|GAIR live
作为上海交通大学自动化系的资深教授,苏剑波坚守着一条科研信条:研究工作需源源不断地注入活力。 他曾阐释这一理念:“一个研究者在踏入某一科学领域时,应选取一个能够长期深耕、并随着理论及技术进步而能不断更新研究内容的主题,这才是研究者始终能保持学术活力的根本原因。 ”苏教授的研究领域覆盖了智能机器人理论与技术、多传感器信息与智能融合、机器学习与人机交互等科学研究持续的热点领域。
3/15/2024 5:20:00 PM
吴彤
资讯热榜
腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen,建模效率提升超七成
OpenAI 重申今夏推出最强模型 GPT-5,具备完整多模态 AI 能力
ChatGPT 商业推荐被曝引用不可靠信息来源,专家提醒用户勿盲目信任
ChatGPT 又遇“奶奶漏洞”,网友成功让 GPT-4o 主动生成“Win7 密钥”
谷歌 Gemini 待发布新技能曝光:AI 帮你生成插画故事书
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
ChatGPT 推出“一起学习”功能:不直接给答案,引导用户自主思考
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
Gemini
AI创作
马斯克
论文
Anthropic
代码
英伟达
算法
Stable Diffusion
智能体
芯片
训练
开发者
生成式
腾讯
蛋白质
苹果
AI新词
神经网络
3D
Claude
研究
生成
LLM
机器学习
计算
Sora
人形机器人
AI视频
AI设计
GPU
AI for Science
xAI
华为
百度
搜索
大语言模型
Agent
场景
字节跳动
预测
深度学习
伟达
大型语言模型
工具
Transformer
RAG
视觉
神器推荐
具身智能
Copilot
模态
亚马逊
AGI
LLaMA
文本
算力
驾驶