AI在线 AI在线

Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜

Yupp AI推出人工评测系统,邀请用户免费体验500+AI大模型并参与评测,生成Yupp AI VIBE排行榜。新用户注册即送5000积分,可对比不同模型回答优劣。#AI评测##大模型#

AI 初创公司 Yupp 日前正式推出一项“人工评测系统”,邀请用户给 ChatGPT、Claude、Gemini、DeepSeek、Grok、Llama 等业界超过 500 款 AI 大语言模型进行打分,Yupp 将根据用户的反馈数据,构建出一套名为 Yupp AI VIBE(Vibe Intelligence Benchmark)的排行榜,用以直观展示不同模型水平。

Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜

据悉,Yupp 由 X 平台前员工 Pankaj Gupta 与 Gilad Mishne 共同创立,旨在让用户低成本使用各大 AI 模型的同时,让用户为模型打分,继而生成一系列模型使用数据及排行榜,以帮助 AI 公司改进其模型

AI在线获悉,平台新注册用户默认拥有 5000 积分,用户平台上输入问题后,平台将随机或根据提示内容选取两个不同的 AI 模型进行作答,并展示双方回答的优劣对比选项,供用户输入反馈评判“哪款模型给出的回答最好”,用户完成反馈后,平台会随机给予用户一定数量的积分,相应积分可用于继续调用 AI 模型。

Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜

同时,平台也支持用户自行指定模型进行比对。每个问题最多可接入 6 个模型进行回复,但若用户反复提问却不提供反馈结果,平台将限制 / 禁止用户继续使用相应服务。

相关资讯

64页论文揭示AI模型排行榜黑幕:Llama4发布前私下测试27个版本,只取最佳成绩

近日,一篇名为《排行榜幻觉》的论文在学术界引发了广泛关注,尤其是对大型语言模型(LLM)领域中备受推崇的 Chatbot Arena 排行榜提出了严厉质疑。 研究指出,排行榜的可信度因数据访问不平等、模型私下测试等问题而受到挑战。 论文显示,一些大型科技公司可以在公开发布之前对多个模型版本进行私下测试。
5/3/2025 11:00:48 AM
AI在线

AIGCRank:2024年4月AI排行榜,5款国内产品上榜全球TOP100

AI在线 发布:2024年4月全球和国内AI网站流量排行榜。 榜单数据来自公开平台,AIGCRank 没有对数据做任何修改,排名公平公正,极具行业参考价值。你可放心转载、分享榜单,获取榜单原始数据请在公众号后台回复「AI」。
5/17/2024 12:13:15 AM

机构:腾讯、百度位列中国人工智能发明专利企业排行榜冠亚军,华为、OPPO 进入前十

感谢全球知识产权综合信息服务提供商 IPRdaily 今日发布中国人工智能发明专利企业排行榜(TOP50)。数据显示,腾讯以 15626 件发明专利排名第一;百度以 13723 件发明专利排名第二;平安集团以 13139 件发明专利排名第三。国家电网、华为、蚂蚁集团、阿里巴巴、京东集团、OPPO、中国移动则位列第四至第十名。该榜单统计近十年在中国申请并公开的人工智能发明专利,“某企业专利”指的是该企业和该企业同一控股股东下的关联公司作为原始申请人及受让人在中国申请的专利。其提取的数据提取时间范围为 2014 年 4
4/22/2024 2:12:09 PM
清源
  • 1