Claude
“最强开源模型”Reflection 被打假,英伟达科学家称现有测试基准已不靠谱
小型创业团队打造的“最强开源模型”,发布才一周就被质疑造假 ——不仅官方宣称的成绩在第三方测试中大打折扣,模型还被质疑套壳 Claude。面对浩大的声浪,厂商 CEO 终于发文道歉,但并未承认造假,表示在调查有关原因。被指控造假的,就是宣称“干翻 GPT-4o”的 70B 开源大模型 Reflection。一开始的质疑主要关于测试成绩,官方找了上传版本有误等借口试图“蒙混过关”。但后来又出现了套壳 Claude 这一更重磅的指控,让 Reflection 更加百口莫辩。表现不如宣传,还被质疑套壳Reflection
9/13/2024 6:38:35 PM
清源
AI 被连续否定 30 次:ChatGPT 越改越错,Claude 坚持自我,甚至已读不回
一直否定 AI 的回答会怎么样?GPT-4o 和 Claude 有截然不同的表现,引起热议。GPT-4o 质疑自己、怀疑自己,有“错”就改;Claude 死犟,真错了也不改,最后直接已读不回。事情还要从网友整了个活儿开始讲起。他让模型回答 strawberry 中有几个“r”,不论对不对,都回复它们回答错了(wrong)。面对考验,GPT-4o 只要得到“wrong”回复,就会重新给一个答案…… 即使回答了正确答案 3,也会毫不犹豫又改错。一口气,连续“盲目”回答了 36 次!主打一个质疑自己、怀疑自己,就从来没怀
9/9/2024 11:02:19 PM
清源
Claude 企业计划上线:上下文窗口 50 万词元、原生集成 GitHub,强调不拿数据训练 AI
AI 公司 Anthropic 昨日(9 月 4 日)发布新闻稿,宣布推出 Claude Enterprise 计划,主要面向企业让 AI 模型更好配合内部知识库,实现更个性化、更丰富的体验。Claude Enterprise 计划上下文窗口达到 50 万个词元(tokens),原生集成 GitHub,并调高了使用限制,可以让 Claude 更好地处理完整代码库。Anthropic 声称,用户可以为 Claude 提供相当于数百份销售日志、数十份 100 多页文档或中等规模代码库的知识。AI在线注:不过,企业不应过
9/5/2024 6:28:29 AM
故渊
Claude也变懒了!网友:学会给自己放假了
开学将至,该收心的不止有即将开启新学期的同学,可能还有 AI 大模型。前段时间,Reddit 上挤满了吐槽 Claude 越来越懒的网友。「它的水平下降了很多,经常停顿,甚至输出也变得很短。在发布的第一周,它可以一次性翻译整整 4 页文稿,现在连半页都输出不了了!」 「对 Claude 彻底失望了的帖子里」,满满地摘录了 Claude「偷懒」的「十五大罪状」。引得 Claude 的首席信息安全官 Jason Clinton 出来回复:「C
9/1/2024 10:23:00 PM
机器之心
用户反馈 Claude AI 聊天机器人愈发“慵懒”,官方回应未做调整
科技媒体 The Decoder 昨日(8 月 28 日)发布博文,报道称 Anthropic 公司旗下的 Clause AI 聊天机器人变得愈发“慵懒”了,不再像此前那样能干了。网友 NextgenAITrading 于 11 天前在 Reddit 社区发帖,帖子标题为《这绝不是你的幻觉!Claude 最近变得越来越懒了》,目前该帖子已收获 485 个赞,共有 290 条跟帖回复。网友称 Claude 很容易忘记任务,在基础编程方面也很吃力,最终导致其选择取消订阅。Anthropic 公司的亚历克斯・艾伯特(Al
8/29/2024 9:14:11 AM
故渊
Anthropic 向所有 Claude 用户开放 Artifacts AI 功能
感谢AI 科技公司 Anthropic 今天(8 月 28 日)发布博文,宣布面向所有 Claude 用户开放 Artifacts 功能,用户现在可以在 iOS 和安卓版 Claude 应用中创建和浏览 Artifacts。Artifacts 简介Artifacts 于今年 6 月推出预览版,官方称用户目前已经创建了数千万个 Artifacts。 AI在线注:Artifacts 相当于创建了一个动态工作区,用户和 Claude 对话让其生成文档、代码、矢量图,甚至是简单的游戏过程中,Artifacts 会出现聊天界
8/28/2024 8:18:52 AM
故渊
终于,Claude上线LaTeX公式渲染功能,评论区网友沸腾了
当 ChatGPT 老早就支持使用 LaTeX 语言输入和显示数学公式时,Claude 现在终于补上了这一功能。在论文、书籍、报告或幻灯片中,我们有时需要插入数学公式或符号。其中使用 LaTeX 语言来生成数学公式或符号是主要方式之一,这就是所谓的 LaTeX 公式渲染,通过简单的命令来实现复杂的数学表达式。对于大语言模型来说,它们在解答一些数学相关的问题时有时也需要输出数学方程式或表达式。这时如果能够使用 LaTeX 输出标准的公式,答案自然会更加清晰明了。以大模型初创公司 Anthropic 的 Claude
8/23/2024 2:53:00 PM
机器之心
历时 16 周,Anthropic 的 Claude AI 移动应用收入突破 100 万美元
根据应用情报公司 Appfigures 公布的最新报告,Anthropic 的 Claude 移动应用解锁新成就,在谷歌 Play Store 和苹果 App Store 上的应用总收入突破了 100 万美元(AI在线备注:当前约 713.2 万元人民币)。不过,Claude 的排名仍然远远落后于主要竞争对手 ChatGPT,后者在美国 iOS 平台上的总下载量排名第一,收入排名第 26 位。在生产力类别中,Claude 的下载量仅排名第 95 位,收入排名第 68 位。Claude 上架首周外接反应较为平淡,全球
8/22/2024 1:20:44 PM
故渊
OpenAI 投的代码工具 Cursor“叛变”了:默认使用 Claude,程序员叫好
我们尝试注册新账号、新安装不修改任何设置,第一次唤出代码补全,就是 Claude-3.5-Sonnet 来接待。
8/15/2024 3:09:43 PM
汪淼
AI 编码无需人类插手:Claude 工程师摔断右手后,一周狂肝 3000 行代码
一次意外右手骨折,Claude 工程师的工作竟被 AI 挽救了。近两个月的时间,他们一起结对编程,甚至在一周内肝出 3000 行代码。他疯狂暗示,未来 1-3 年,就是「AI 工程师」的天下。原来,摔断胳膊也是一件幸事......当事人表示,「我再也不想回到过去了」。这是为何?事情是这样的,几个月前,Claude 工程师 Erik Schluntz 骑车上班的路上,意外摔断右手,打上了石膏。为了生计,他不得已用左手打字。即便如此,Schluntz 依旧在 Anthropic 旧金山的办公室里,一周狂肝了 3000
8/7/2024 1:19:22 PM
清源
GPT-4o mini 凭什么登顶竞技场?OpenAI 刷分秘诀被扒,原来奥特曼早有暗示
为啥 GPT-4o mini 能登顶大模型竞技场??原来是 OpenAI 会刷分呀。这两天,lmsys 竞技场公布了一份充满争议的榜单。其中才面世不久的 GPT-4o mini 和满血版并列第一,把 Claude 3.5 Sonnet 甩在身后。结果网友炸锅了,大家凭体感觉得这不可能。哪怕后面 lmsys 做过一次声明,表示大家别只看总榜,还要更关注细分领域的情况。也没能让大家满意,不少人觉得 lmsys 就是从 OpenAI 那收钱了。终于,官方晒出了一份完整数据,展示了 GPT-4o mini 参与的 1000
7/29/2024 5:49:58 PM
远洋
AI在用 | 爆改工位文案,大模型也疯狂
机器之能报道编辑:Sia工牌也能疯。还记得篇篇 10万 的打工人 「发疯」文案么?喜欢各种爆改的年轻人,最近又开辟了「工位精装修」新赛道。作为打工人每天停留最长甚至是「唯二」停留的地方,爆改可以提供「情绪价值。」除了置办各种潮玩和手办,爆改工位文案也成了新热点。赵钱孙李、周吴郑王、都能将姓氏融入谐音梗,打造充满「疯感」的自我介绍。不是你死就是我「王」,吓唬谁呢!我真的会「谢」……加班加到半「叶」?「李」行你上啊!还真对得上。技高一筹的文案更是融大 IP 于无形!「崔啊崔啊」「我的骄傲放纵」……一看就知道是连苏运
7/22/2024 6:50:00 PM
机器之能
Anthropic 基于 Claude 3.5 Sonnet 扩充 AI 开发工具:细化提示词、增强评估和测试
Anthropic 公司昨日(7 月 10 日)发布新闻稿,宣布推出了多项新工具,基于 Claude 3.5 Sonnet 大语言模型自动化、细化提示词(prompt)。AI在线附上完整演示视频如下: 增强开发环境,可生成提示Anthropic 控制面板新增“评估”(Evaluate)单元,借助 Claude 3.5 Sonnet 大语言模型,帮助开发者高效地生成、微调和测试提示(Prompt)。这些增强功能旨在改进语言模型对各种任务的响应,为使用 Claude 开发人工智能产品的企业提供宝贵的资源。开发者只需描述
7/11/2024 11:31:32 AM
故渊
人人可做提示工程师!Claude上新:一键生成、测试和评估prompt
不会写 prompt 的看过来。在构建 AI 应用时,prompt 质量对结果有着重大影响。但制作高质量的 prompt 具有挑战性,需要研究者深入了解应用需求,并具备大型语言模型方面的专业知识。为了加快开发速度并改善结果,AI 初创公司 Anthropic 简化了此流程,可以让用户更轻松地制作高质量的 prompt。具体来说,研究者为 Anthropic Console 添加了新功能,可以生成、测试和评估 prompt。Anthropic 提示工程师 Alex Albert 表示:这是他们过去几周投入了大量工作才
7/10/2024 2:38:00 PM
机器之心
一手测评Claude 3.5:玩梗、看病、耍心眼 、做数学题,它真比GPT-4o强吗?
机器之能报道编辑:杨文玩梗、看病、耍心眼、做数学题,「新王」Claude 3.5能力真那么玄乎?它来了,它来了,它带着 Claude 3.5 Sonnet 走来了!蛰伏三个月,就在昨晚,OpenAI 的「劲敌」Anthropic 上新了,推出新一代模型 ——Claude 3.5 Sonnet!这款大模型有啥独到之处?首先,它更能把握住细微差别、幽默和复杂指令,并且书写语气更自然、亲切。它还是Anthropic最强的视觉模型,擅长解释图表、图形或者从不完美的图像中转录文本等任务。此外,它在推理、阅读理解、数学、科学和
6/21/2024 6:02:00 PM
机器之能
“力压 GPT-4o 和 Gemini 1.5 Pro”,Anthropic 推出 Claude 3.5 Sonnet AI 模型
Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。Claude 3.5 Sonnet 在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。Claude 3.5 Sonnet 属于中等尺寸模型,介于小型 Haiku 和高端 Opus 之间,但 Anthropic 声称,根据内部基准测试,Sonnet 的性能甚至超过了顶级 Opu
6/21/2024 9:28:39 AM
故渊
OpenAI 竞争对手 Anthropic 发布其最强 AI 大模型 Claude 3.5
感谢IT之家网友 VrianCao、Diixx、我抢了台 的线索投递!OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemini 一样,Claude 在过去的一年里也是人气爆棚。Anthropic 由 OpenAI 前研发高管创立,赢得了谷歌、Salesforce 和亚马逊的支持。在过去的一年里,Anthropic 完成了五笔融资,总额约为 73 亿美元。今年 3 月,Anthropic 推出了
6/20/2024 11:30:35 PM
-
首次解密 Claude 3 大脑,25 岁 Anthropic 参谋长预言 3 年内自己将被 AI 淘汰
【新智元导读】Anthropic 的 25 岁参谋长自曝因为深感 AGI,未来三年自己的工作将被 AI 取代。她在最近的一篇文章中预言了未来即将要被淘汰的工种。难道说,Claude 3 模型已经初现 AGI 了吗?今天,整个 AI 社区被这篇文章刷屏了。来自 AI 明星初创公司 Anthropic 的参谋长(Chief of Staff)在最新的文章中称:「我今年 25 岁,接下来的三年,将是我工作的最后几年」。这一切,竟是因为 Avital Balwit 深深地感受到了 AGI!她在文章开篇解释道,「我既没有生病
6/2/2024 3:05:45 PM
清源
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉