Auto-J
评论能力强于GPT-4,上交开源13B评估大模型Auto-J
随着生成式人工智能技术的快速发展,确保大模型与人类价值(意图)对齐(Alignment)已经成为行业的重要挑战。虽然模型的对齐至关重要,但目前的评估方法往往存在局限性,这也让开发者往往困惑:大模型对齐程度如何?这不仅制约了对齐技术的进一步发展,也引发了公众对技术可靠性的担忧。为此,上海交通大学生成式人工智能实验室迅速响应,推出了一款全新的价值对齐评估工具:Auto-J,旨在为行业和公众提供更加透明、准确的模型价值对齐评估。论文地址:::,该项目开源了大量资源,包括:Auto-J 的 130 亿参数模型(使用方法,训
10/23/2023 2:30:00 PM
GAIR
- 1
资讯热榜
Kimi K2 高速版kimi-k2-turbo-preview发布 输出每秒 40 Tokens
一次中稿10篇ACL25,通义实验室 代码智能&对话智能团队 在研究什么
多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型
OpenAI 被曝向搜索引擎公开 ChatGPT 共享对话内容,后因隐私风险叫停
测试不同的RAG技术以找到最佳方案
Kimi K2高速版发布 输出速度提升至每秒40 Tokens
马斯克、吴恩达青睐,黄仁勋批评,见证百度、OpenAI内部起落,Anthropic CEO自曝式采访:诞生四年,每年营收十倍增长
OpenAI 回应“ChatGPT 用多了会变傻”:AI 本质上是工具,关键在如何使用
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
英伟达
Anthropic
代码
算法
训练
Stable Diffusion
芯片
开发者
蛋白质
腾讯
LLM
生成式
苹果
Claude
神经网络
Agent
AI新词
3D
机器学习
AI for Science
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
搜索
大语言模型
具身智能
场景
RAG
字节跳动
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
架构
Copilot
DeepMind
模态
安全