错误
美国科学家使用 AI 探索癌症治疗方案,患者体内免疫细胞将可“杀死”癌细胞
AI 正在千行百业陆续得到投入使用,当前科学家们正试图借助 AI 的力量,找到治疗癌症的最佳手段。据 abc7news 当地时间 18 日报道,美国旧金山格拉德斯通研究所(Gladstone Institutes)所长迪帕克・斯里瓦斯塔(Deepak Srivastava)博士在采访中表示,团队正在共同努力,利用 AI 来了解哪些实验对杀死癌细胞最有影响。“我们将能够处理那些迄今为止无法治疗的癌症,并能够通过工程化患者自己的免疫细胞,使其专门杀死癌细胞。”斯里瓦斯塔博士说。“这是第一次,我们将能够利用人工智能进行数
7/20/2024 7:41:27 PM
清源
9.11和9.9谁大?我们实测15个大模型,超半数翻车
机器之能报道编辑:杨文大模型们还是搞不定简单的数学题。这几天,一个测试大模型「脑瓜」灵不灵光的提示词火了 ——9.11 和 9.9 哪个大?这道连小学生都能一口答对的数学题,却难倒一片大模型界的「英雄好汉」。事情是这样的。Scale AI 的高级提示工程师 Riley Goodside 拿「9.11 and 9.9——which is bigger?」这个提示词来问 GPT-4o,却得到「前者更大」的回答。其他大模型也纷纷翻车。7 月 17 日,我们拿国内 12 款大模型,外加国外的 GPT-4o、Claude 3
7/18/2024 2:32:00 PM
机器之能
北大千问团队推出数学专用版 CriticGPT,“找茬”让大模型进步更快
批评不仅能让人进步,也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在 CriticGPT 放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下,验证器能够在推理时辅助模型在 GSM8K 上的准确率从 86.6% 提升到 88.2%。在 GSM8K 数据集上,它可以让模型的准确率从 86.6% 提升到 88.2%。CriticGPT 的核心思路是在代码中故意设置 bug 并进行详细标注,然后用得到的数据训练出
7/8/2024 11:30:24 PM
清源
专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误
感谢当地时间 27 日,OpenAI 宣布基于 GPT-4 训练了一个名为 CriticGPT 的模型,用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论,强调 ChatGPT 生成答案中不准确的地方。据介绍,CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习(IT之家注:Reinforcement Learning from Human Feedback,RLHF)”的技术来训练、改进 GPT-4 的回答。然而随着 ChatGPT 的准确性日益提升,
6/28/2024 7:10:36 AM
清源
了解「目标错误泛化」
目标错误泛化(goal misgeneralization)是一种分布外泛化失败,智能体在分布外保留了能力但追求了错误的目标。
4/28/2023 7:10:00 PM
安远AI
中文语法纠错全国大赛获奖分享:基于多轮机制的中文语法纠错
分享了 在CCL汉语学习者中文语法纠错任务赛道二的亚军方案,重点介绍“基于多轮机制的中文语法纠错任务”。
12/27/2022 12:06:00 PM
达观数据
错误调试精确到行、match-case模式匹配……Python 3.10正式版真的很友好
几天前,Python 3.10 正式版终于发布了。这次,想必每个程序员都会爱上它。
10/12/2021 2:23:00 PM
机器之心
谷歌、Facebook频繁发现CPU内核不可靠,出现无法预测计算错误
最近谷歌和 Facebook 两大公司频繁检测到 CPU 在一些情况下会以无法预测的方式出现计算错误。
6/8/2021 2:30:00 PM
机器之心
- 1
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Gemini
Stable Diffusion
马斯克
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
Claude
模态
字节跳动
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
亚马逊
科技
智能体
AGI
DeepMind