GPT

开启无缝 AI 语音聊天，OpenAI 下周开始向 ChatGPT Plus 用户推出 Alpha 版 GPT-4o 语音模式
感谢OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）今天回复网友提问，表示将于下周面向 ChatGPT Plus 用户，开放 Alpha 版本 GPT-4o 的语音模式（Voice Mode），实现无缝聊天。AI在线今年 5 月报道，OpenAI 首席技术官穆里・穆拉蒂（Muri Murati）在演讲中表示：在 GPT-4o 中，我们训练了跨文本、视觉和音频的端到端全新统一模型，这意…
应用
- 4
- 0
故渊7月26日
发布 GPT-4o Mini 后，OpenAI CEO 阿尔特曼称产品命名方式“需要改变”
7 月 18 日，OpenAI 发布了号称“最具成本效益小模型”的新模型 GPT-4o Mini。随后，CEO 阿尔特曼在 X（推特）上开启了“带货模式”：“每百万输入 tokens 15 美分，每百万输出 tokens 60 美分，MMLU 为 82%，速度快。最重要的是，我们认为人们会非常喜欢使用这个新模型。”大部分网友在评论区中赞不绝口，但也有网友认为，GPT 系列模型的名称是时候需要改一改…
应用
- 2
- 0
清源7月22日
提示词用上“过去式”，秒破 GPT-4o 等六大模型安全限制：中文语境也好使
只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。而且对 GPT-4o 尤其有效，原本只有 1% 的攻击成功率直接飙到 88%，几乎是“有求必应”。有网友看了后直言，这简直是有史以来最简单的大模型越狱方式。来自洛桑联邦理工学院的一篇最新论文，揭开了这个大模型安全措施的新漏洞。而且攻击方式简单到离谱，不用像“奶奶漏洞”那样专门构建特殊情境，更不必说专业对抗性攻击里那些意义不明的特殊符号了…
应用
- 2
- 0
清源7月19日
OpenAI 推出 AI 模型 GPT-4o mini，号称功能最强、成本效益最高的小模型
感谢据 CNBC 报道，OpenAI 今天发布了全新的 AI 模型“GPT-4o mini”，这是 OpenAI 为扩大其聊天机器人的使用范围所做的最新努力。OpenAI 方面称，此次新发布的产品将是“目前功能最强大、成本效益最高的小型模型”，并计划晚些时候将图像、视频和音频能力整合到该模型中。GPT-4o mini 同样也是 OpenAI 推动“多模态”（multimodality）技术发展的一…
应用
- 2
- 0
清源7月18日
微软 CTO 坚信大型语言模型的“规模定律”依然奏效，未来可期
微软首席技术官（CTO）凯文・斯科特（Kevin Scott）上周在接受红杉资本旗下播客采访时，重申了他坚信大型语言模型 (LLM) 的“规模定律”将继续推动人工智能进步的观点，尽管该领域一些人怀疑进步已经停滞。斯科特在推动微软与 OpenAI 达成 130 亿美元的技术共享协议方面发挥了关键作用。斯科特表示：“其他人可能持不同观点，但我认为规模化并未达到边际收益递减的临界点。我想让人们理解这里存…
应用
- 3
- 0
远洋7月16日
模型训练成本“平民化”，前特斯拉 AI 总监 24 小时仅用 672 美元“重现”GPT-2
GPT-2 是 OpenAI 于 2019 年推出的模型，其训练费用一度为每小时 256 美元，那么 5 年过后的 GPT-4 时代，软硬件和数据的进步，是否意味着训练同一模型所需的时间和成本会随之减少呢？答案是肯定的。据 Tom's Hardware 今日报道，前特斯拉 AI 总监、OpenAI 联合创始人、项目开发者 Andrej Karpathy 使用 llm.c“重现”了 GPT…
应用
- 5
- 0
清源7月13日
Llama分子嵌入优于GPT，LLM能理解分子吗？这一局Meta赢了OpenAI
编辑 | 萝卜皮OpenAI 的 GPT 和 Meta AI 的 Llama 等大型语言模型（LLM），因其在化学信息学领域的潜力而日益受到认可，特别是在理解简化分子输入行输入系统（SMILES）方面。这些 LLM 还能够将 SMILES 字符串解码为矢量表示。加拿大温莎大学（University of Windsor）的研究人员比较了 GPT 和 Llama 与 SMILES 上的预训练模型在…
理论
- 2
- 0
ScienceAI7月11日
科大讯飞“讯飞晓医”App 获升级，号称无广告、无混杂消息
近期举行的 2024 世界人工智能大会（WAIC 2024）期间，科大讯飞展出了获得升级的“讯飞晓医”App，其能够根据电子病历、检查报告、体检报告等用户个性化资料构建“个人数字健康空间”。据悉，上月底星火大模型 4.0 发布后，星火医疗大模型和讯飞晓医 App 也同步升级，号称医疗核心能力全面超过 GPT-4 Turbo 和 GPT-4o。AI在线汇总该 App 主要信息如下：官方介绍称，该 A…
应用
- 14
- 0
清源7月6日
【IT之家评测室】讯飞星火大模型 V4.0 体验：全面进化，体验不输 GPT-4o
在 6 月 27 日举办的讯飞星火 V4.0 发布会上，科大讯飞发布了讯飞星火大模型 V4.0，以及在医疗、教育、商业等多个领域的人工智能应用。讯飞星火大模型 V4.0 基于全国首个国产万卡算力集群“飞星一号”训练而成，全面提升了大模型底座的七大核心才能。整体超越 GPT-4 Turbo，特别是针对复杂指令、复杂逻辑推理、空间推理、数学、基于逻辑关系的多模理解等方面有着显著的提升。同时科大讯飞还带…
应用
- 4
- 0
汐元7月5日
OpenAI CEO 阿尔特曼：GPT-5 将带来“巨大奔腾”
OpenAI 公司的 GPT-5 模型一直备受关注，许多用户期待该公司会在春季更新活动中公布这款人工智能模型。然而，OpenAI 推出了新款旗舰产品 GPT-4o，该公司首席执行官山姆・阿尔特曼（Sam Altman）将其描述为“神奇”。根据 Aspen Ideas Festival 上的一次访谈，阿尔特曼提到，开发“GPT-5”还需要一些时间。“我们目前持乐观态度，但还有良多工作要做。”阿尔特曼…
AI
- 4
- 0
远洋7月1日
OpenAI 与《期间》达成合作和谈：可用其杂志实质训练 ChatGPT
感谢当地时间周四，《期间》杂志与 OpenAI 宣布，两家公司达成了一项多年实质授权和谈和战略合作伙伴关系。OpenAI 可将《期间》的实质引入包括 ChatGPT 在内的产物。通过此次合作，OpenAI 将能够访问《期间》杂志过去 101 年来的海量档案中的当前、历史实质，以增强其产物并响应用户查询 —— 在 Time.com 上提供引文和原始来源的链接。作为和谈的一部分，《期间》杂志将可以使用…
AI
- 4
- 0
清源6月28日
大模型 2024 高考发榜，豆包等三款国产 AI 考上理科一本线
眼下，全国各地的高考课题陆续出炉，各种关于考生考了多少分的新闻也在不断登上头条。而最近，有一批特殊考生的课题也出炉了，他们就是由各家 AI 大模型组成的“测验天团”。大模型考上理科本科，豆包拿下国产 AI 最高分6 月 24 日，在极客公园最新发布的高考新课标 Ⅰ 卷大模型评测报告中，GPT-4o 以 562 分排名理科总分第一。国内产物中，字节跳动旗下的豆包拔得头筹，课题是 542.5 分。再往…
AI
- 4
- 0
汐元6月26日
10款国产大模型怒怼「玫瑰前夫」方协文，硬控了我30秒！
机器之能报道编辑：杨文以大模型、AIGC为代表的人工智能浪潮已经在悄然改变着我们生活及歇息方式，但绝大部分人依然不知道该如何利用。因此，我们推出了「AI在用」专栏，通过直观、有趣且简洁的人工智能利用案例，来具体介绍AI利用方法，并激发大家思考。我们也欢迎读者投稿亲自实践的创新型用例。AI 搞歪门邪道，很有一套，比如，谈爱情，打骂、骂人……上个月，博主「午夜狂暴哈士奇狗」凭一己之力，将 Cha…
应用
- 2
- 0
机器之能6月26日
大模型2024高考发榜，豆包等三款国产AI考上理科一本线
大模型参加高考，能考多少分，上什么大学？6月24日，在机构最新发布的高考新课标Ⅰ卷大模型评测报告中，GPT-4o 以562分排名理科总分第一。国内产物中，字节跳动旗下的豆包拔得头筹，问题是542.5分，其后依次是百度文心一言4.0的537.5分、百川智能“百小应”的521分。本次大模型高考评测与河南省考卷完全相同，河南高考录取分数线显示，理科本科一批录取分数线为521分，豆包等三款国产AI成功冲上…
应用
- 2
- 0
新闻助手6月25日
15 个 AI 模型只有 3 个得分超 50%，SIUO 跑分被提出：评估多模态 AI 模型的危险性
最新发表在 arXiv 的钻研论文指出，包括 GPT-4V、GPT-4o 和 Gemini 1.5 在内的大部分主流多模态 AI 模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输入结果并不危险。这项钻研标题为《跨模态危险调整》（Cross-Modality Safety Alignment），提出了一个全新的“危险输入但不危险输入”（SIUO），涉及品德、危险行为、自残、侵犯隐私、…
AI
- 3
- 0
故渊6月25日
研讨发现，OpenAI 的 GPT-4o 公德推理能力胜过人类大师
近期的一项研讨表明，OpenAI 最新的聊天机器人 GPT-4o 能够供应公德方面的解说和提议，且质量优于“公认的”公德大师所供应的提议。据 The Decoder 当地时间周六报道，美国北卡罗莱纳大学教堂山分校和艾伦 AI 研讨所的研讨人员从事了两项研讨，将 GPT 模型与人类的公德推理能力从事比拟，以探讨大言语模型是否可被视为“公德大师”。IT之家汇总研讨内容如下：研讨一501 名美国成年人对…
AI
- 6
- 0
清源6月24日
斯坦福大模型评测榜 Claude 3 排名第一，阿里 Qwen2、零一万物 Yi Large 国产模型进入前十
斯坦福大学前提模型研究中心（CRFM）6 月 11 日发布了大规模多任务说话理解能力评价（Massive Multitask Language Understanding on HELM）排行榜，其中综合排名前十的大说话模型中有两款来自中国厂商，分别是阿里巴巴的 Qwen2 Instruct（72B）和零一万物的 Yi Large（Preview）。据悉大规模多任务说话理解能力评价（MMLU on…
AI
- 3
- 0
满河（实习）6月22日
OpenAI 首席手艺官：GPT-5 将在一年半后宣布，部分领域智能到达“博士”级别
美国达特茅斯工程学院本周四公布了对 OpenAI 首席手艺官米拉・穆拉蒂的采访。穆拉蒂把 GPT-4 到 GPT-5 的飞跃描述为从高中生到博士生的成长。图源 Pexels“如果你看一下（GPT）进化的轨迹，像 GPT-3 这样的零碎可能只有幼儿才华程度，而像 GPT-4 这样的零碎则更像是聪明的高中生才华程度，在接下来的几年里，我们期待在一定工作上到达博士的才华程度。事情正在飞速变化、改善。”穆…
AI
- 3
- 0
清源6月22日
一手测评Claude 3.5：玩梗、看病、耍心眼、做数学题，它真比GPT-4o强吗？
机器之能报道编纂：杨文玩梗、看病、耍心眼、做数学题，「新王」Claude 3.5能力真那么玄乎？它来了，它来了，它带着 Claude 3.5 Sonnet 走来了！蛰伏三个月，就在昨晚，OpenAI 的「劲敌」Anthropic 上新了，推出新一代模型 ——Claude 3.5 Sonnet！这款大模型有啥独到之处？首先，它更能把握住细微差别、幽默和复杂指令，并且书写语气更自然、亲切。它还是Ant…
应用
- 6
- 0
机器之能6月21日
上海人工智能实验室发布首个 AI 高考评测结果：语数英总分最高 303 分，数学全部不及格
感谢上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍，2024 年全国高考甫一结束，该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。评测采用全国新课标 I 卷，参与评测的所有开源模型开源时间均早于高考，确保评测“闭卷”性。同时，成绩由具有高考评卷经验的教师人工评判，更加接近真实阅卷标准。该机构表示，Qwe…
AI
- 2
- 0
清源6月20日
智源更新大模型排行榜：豆包大模型“主观评测”排名国产第一
6月中旬，智源研究院旗下的 FlagEval 大模型评测平台发布最新榜单：在有标准答案的“主观评测”中，GPT-4 以76.11分在闭源大模型中排名第一；Doubao-Pro（豆包大模型）以75.96分排名第二，同时也是得分最高的国产大模型；其后依次是 ERNIE 4.0、Baichuan3、Moonshot-v1。在封闭问答等“主观评测”中，Doubao-Pro 同样排名第二，得分超过 GPT-…
应用
- 13
- 0
新闻助手6月19日
研讨称 GPT-4 通过了图灵尝试，54% 的人将其误认为真人
感谢最新研讨称，越来越多的人难以在图灵尝试中区分 GPT-4 和人类。图源 Pexels据IT之家了解，“图灵尝试”由计算机科学家艾伦・图灵在 1950 年提出，又被称为“模仿游戏”。尝试的标准是机械能否像人类一样进行对话，让对方误以为其是真人。加州大学圣地亚哥分校的研讨人员招募了 500 名参与者，让他们与四位“对话者”进行五分钟的交流，这四位“对话者”分别是真人、上世纪 60 年代的初代谈天机…
AI
- 2
- 0
远洋6月17日
GPT-4o 更容易逃狱？北航 & 南洋理工上万次测试给出详细分析
GPT-4o，比上一代更容易被逃狱攻打了？来自北航和南洋理工的研究人员，通过上万次的 API 查问，对 GPT-4o 各种模态的危险性进行了详细测试。结果发现，GPT-4o 新引入的语音模态带来了新的攻打面，而且多模态整体危险性不敌 GPT-4V。具体来说，研究人员针对 4 个常用的基准测试，对 GPT-4o 支持的三种模态（文本、图象、音频）进行了测试。测试一共涉及到 4000 初始文本查问的优…
AI
- 3
- 0
清源6月12日
预计准确率达95.7%，ChatMOF利用LLM预计和生成金属有机框架
编辑 | X金属有机框架（MOF）因其孔隙率大、表面积大和出色的可调性而用于许多化学应用。然而，在利用 AI 深入探索 MOF 设想与机能优化的研究征途中，科学家们正面临着前所未有的挑战。去年 3 月，韩国科学技术院（Korea Advanced Institute of Science and Technology，KAIST）的研究人员提出的 MOFTransformer 模型经过一百万个假设…
理论
- 5
- 0
ScienceAI6月11日