资讯列表
字节跳动研究开源 ChatTS-14B:原生理解并随着时间的推移进行推理
字节跳动研究团队宣布开源 ChatTS-14B,这是一款专为时间序列数据理解和推理设计的140亿参数大型语言模型(LLM)。 以 Apache2.0许可协议发布,ChatTS-14B 的开源引发了 AI 社区的广泛关注,被认为是时间序列分析与生成式 AI 结合的重大进展。 ChatTS-14B:时间序列的智能对话引擎ChatTS-14B 基于 Qwen2.5-14B-Instruct 模型进行微调,专为处理时间序列数据而设计,能够理解和推理复杂的时序数据模式。
4/21/2025 10:00:57 AM
AI在线
OpenAI o3 模型测试成绩遭质疑,实际表现远低于宣传
近日,OpenAI 推出的 o3人工智能模型在基准测试中的表现引发了广泛争议。 尽管 OpenAI 在去年12月首次发布 o3时自信地宣称该模型在极具挑战性的 FrontierMath 数学问题集上能够正确回答超过四分之一的问题,但这一声称与最近的独立测试结果形成鲜明对比。 Epoch 研究所对 o3模型进行了独立测试,结果显示该模型的实际得分仅为10%,远低于 OpenAI 之前所宣称的25%。
4/21/2025 10:00:56 AM
AI在线
Netflix推全新 AI 搜索功能,用户可通过自然语言搜索
Netflix 近日开始测试一项全新的 AI 搜索功能,这一功能基于 OpenAI 的技术,旨在提升用户在流媒体平台上的内容发现体验。 用户将能够通过自然语言来搜索影片,不再局限于传统的按类型或演员进行搜索。 据彭博社的报道,这项新功能能够理解用户更具体的需求,包括他们的观影心情。
4/21/2025 10:00:56 AM
AI在线
可信AI技术获中国电子学会科技进步一等奖,蚂蚁数科助力破解大模型应用“安全可信”难题
4月19日,2024年度中国电子学会科学技术奖在第十八届中国电子信息年会揭晓并颁奖,由清华大学、北京中关村实验室和蚂蚁集团等单位共同完成的联合项目《高效协作的互联网动态行为安全可信关键技术与应用》荣获科技进步奖一等奖。 近年来,网络环境日益复杂,恶意流量攻击和隐蔽未知应用风险在互联网中泛滥,如何构建一个更安全可信的互联网环境,成为学术界和产业界的共同追求。 由清华大学、北京中关村实验室及蚂蚁集团等联合提出的“高效协作的互联网动态行为安全可信关键技术”,创新提出了分层传递和高效求解的智能协作体系技术思路,通过模型表达、知识共享和应用支撑,在实现安全信息获取、传递和协作的同时,显著提升了互联网应对未知应用风险的能力。
4/21/2025 9:47:00 AM
新闻助手
清华张亚勤:10年后,机器人将可能比人都多
“10年后,机器人将可能比人都多,会陆续进入工厂、社会,最终形态是进入家庭。 未来每个人、每个家庭都有机器人。 ”这样的预言,来自清华大学智能产业研究院(AIR)院长张亚勤。
4/21/2025 9:30:00 AM
量子位
OpenAI爆出硬伤,强化学习是祸首!o3越强越「疯」,幻觉率狂飙
满血o3更强了,却也更爱「胡言乱语」了。 OpenAI技术报告称,o3和o4-mini「幻觉率」远高于此前的推理模型,甚至超过了传统模型GPT-4o。 根据PersonQA基准测试,o3在33%的问题回答中产生了幻觉,几乎是o1(16%)的2倍。
4/21/2025 9:27:00 AM
新智元
全球首个:阿联酋尝试用 AI 制定和修改法律
阿联酋正尝试利用AI技术制定和修改法律,成立监管智能办公室推进相关工作。AI将定期提出立法更新建议,预计使立法速度加快70%。然而,专家警告AI可能存在偏见和可靠性问题。#AI立法# #阿联酋科技#
4/21/2025 9:26:09 AM
远洋
杀疯了!Gemini 2.5狂飙「高尔顿板」测试,编码横扫所有OpenAI模型
编码能力一直是顶尖模型宣传的重点。 尤其是,AI大神Karpathy带火vibe coding(氛围编程)概念后,普通人也可以通过AI体验到编程的乐趣。 游戏、网页、3D建模,再加上最近爆火的MCP协议,大家玩得不亦乐乎。
4/21/2025 9:15:00 AM
新智元
文科已死,计算机科学将亡?ACM警告:不想被AI团灭,关键在融合新生
GenAI日新月异,引发了大众选择职业和大学专业的焦虑。 但最近,美国的国际计算机协会(Association for Computing Machinery,ACM),发布了一篇博客文章,表示:文科和计算机科学,这两个专业最后可能合流,融合在一起才能存活。 在哲学中,「存在危机」指的是质疑自己人生目的、意义和在世界中位置的状态。
4/21/2025 9:14:00 AM
新智元
Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强
过去几年,Transformer虽稳坐AI架构「铁王座」,但其二次方复杂度带来的算力消耗和长序列处理瓶颈,限制了大模型在推理阶段处理长文本。 Mamba凭借「线性复杂度」异军突起,非常适合长序列任务,有望成为Transformer架构的替代品,但在处理全局关系上偏弱。 Mamba Transformer混合架构可以将二者的优势互补,实现「效率」和「性能」的双丰收。
4/21/2025 9:07:00 AM
新智元
OpenAI 4o图像生成支持自定义GPTs,个性化AI创作再升级
近日,OpenAI宣布其最新4o模型的图像生成功能将支持自定义GPTs,为用户提供更灵活的个性化AI创作体验。 据AIbase了解,这一更新允许开发者与用户基于4o模型构建定制化的GPTs,生成符合特定需求的高质量图像内容。 消息一经发布,便引发了AI社区的广泛讨论,标志着OpenAI在个性化AI工具领域的又一重要进展。
4/21/2025 9:00:47 AM
AI在线
Reachy2机器人发布:互动自然,售价 7万美元
Hugging Face 宣布通过收购法国初创公司 Pollen Robotics,正式推出开源人形机器人 Reachy2。 这一消息在社交媒体和 AI 社区引发热烈讨论,被认为是人形机器人与生成式 AI 结合的重要里程碑。 作为专为 AI 研究和教育设计的“实验室伙伴”,Reachy2以其开源特性、先进功能和人性化设计,迅速成为全球顶尖实验室的关注焦点。
4/21/2025 9:00:47 AM
AI在线
Intel 开源 AI Playground,可用intel Arc 显卡使用各种AI模型
Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,这一举措引发了 AI 社区的广泛关注。 作为一款专为 Intel Arc GPU 和集成显卡优化的 AI 工具,AI Playground 被描述为一个“AI 中心”,支持本地运行聊天式大语言模型(LLM)以及图像和视频生成功能。 此次开源标志着 Intel 在推动生成式 AI 技术普及和社区协作方面迈出了重要一步。
4/21/2025 9:00:47 AM
AI在线
这样在本地搭建DeepSeek可以直接封神:本地部署+避坑指南(升级版)
本文旨在提供一个全面且详细的DeepSeek本地部署指南,帮助大家在自己的设备上成功运行DeepSeek模型。 无论你是AI领域的初学者还是经验丰富的开发者,都能通过本文的指导,轻松完成DeepSeek的本地部署。 一、本地部署的适用场景DeepSeek本地部署适合以下场景:高性能硬件配置:如果你的电脑配置较高,特别是拥有独立显卡和足够的存储空间,那么本地部署将能充分利用这些硬件资源。
4/21/2025 8:47:18 AM
冰河
让DeepSeek更可靠!清华提出Hyper-RAG,用超图提升知识建模精准度
大语言模型(Large Language Models, LLMs)在面对专业领域知识问题的时候,经常会生成偏离既定事实的回复,或模糊不清的回答,从而带来了潜在应用风险。 检索增强生成(Retrieval-Augmented Generation, RAG)通过构建特定领域知识库,采用基于向量的检索技术来提取与给定查询相关的信息,从而使LLM能够生成更准确、更可靠的内容。 然而,现有的基于图的RAG方法受限于仅能表示实体之间的成对关联,无法表示那些更复杂的多实体间的群组高阶关联,导致数据结构化过程中这些高阶信息的丢失。
4/21/2025 8:45:00 AM
新智元
DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制
推理模型的内心世界是怎么想的? 推理模型与普通LLM之间有没有本质的区别? 一直以来,AI内部的运作机理就像个「黑箱子」。
4/21/2025 8:42:00 AM
新智元
LeCun被痛批:你把Meta搞砸了!烧掉千亿算力,自曝折腾20年彻底失败
凭借着GPT/o系列、Gemini 2.5、Claude的强大能力,OpenAI、谷歌、Anthropic纷纷在AI大战中各领风骚。 唯独Meta,没有走在前沿。 Llama 4自发布以来种种拉跨的表现,让Meta在某种程度上沦为了业内的「笑柄」。
4/21/2025 8:40:00 AM
新智元
OpenAI CFO重磅曝料:AGI近在咫尺,全球最强编程智能体已就绪!
OpenAI,正引领生成式AI的革命浪潮。 这家公司如何确立行业领先地位? 又采取了哪些策略保持竞争优势?
4/21/2025 8:35:00 AM
新智元