资讯列表
谷歌 AI 模式新增多模态搜索,支持图像提问功能
谷歌搜索AI模式新增多模态搜索功能,用户可上传照片提问,AI能识别图像中的物体关系并提供详细回答。例如拍摄书架照片,询问类似书籍推荐。该功能由Google Lens支持,目前向实验室计划用户开放。#谷歌AI##多模态搜索#
4/8/2025 11:58:02 AM
远洋
谷歌 Gemini AI 升级文件分析功能,将支持 3GP、AVI、MP4 等 8 种视频格式
科技媒体 Android Authority 今天(4 月 8 日)发布博文,通过分析 APK 文件,发现谷歌 Gemini 即将升级文件分析功能,新增支持 3GP、AVI、FLV 等 8 种视频格式。
4/8/2025 11:24:00 AM
故渊
Deepseek 突破 AI 训练烧钱魔咒:1.2 万美元 1/525 成本 MT-Bench 跑分媲美 GPT-4o
深度求索(DeepSeek)联合清华大学,合作推出全新 AI 对齐技术 SPCT(自我原则点评调优),突破传统依赖海量训练数据的模式,通过推理阶段动态优化输出质量。
4/8/2025 10:33:03 AM
故渊
《纽约时报》等媒体联盟宣战,向“白嫖”内容训练 AI 说不
美国新闻/媒体联盟发起“支持负责任AI”运动,呼吁政府强制科技巨头为AI使用内容付费,强调创意产业是国家竞争力核心。#AI版权争议# #科技巨头#
4/8/2025 10:12:28 AM
故渊
首次引入强化学习!火山引擎Q-Insight让画质理解迈向深度思考
从 GPT-4o 吉卜力风、即梦的 3D 动画、再到苹果 Vision Pro,AI 视觉创作正迎来生产力大爆炸。 一个重要问题随之浮现:如何评估机器生成的画质符合人眼审美? 人眼能瞬间辨别图像优劣,但教会机器理解「好看」却充满挑战。
4/8/2025 9:50:00 AM
机器之心
2025 CSRankings排名出炉!上交大、清华北大、浙大霸榜全球AI TOP 10
就在刚刚,2025 CSRankings全球计算机科学排名发布! 地址:,CMU再次霸榜,UIUC曾连续多年稳坐全球第二,如今跌至第6。 中国高校/机构继续包揽多个席位,其中清华排名第2,上交大/浙大并列第3,北大第5。
4/8/2025 9:42:00 AM
新智元
奥特曼力挺年轻人「套壳」,25年程序员效率暴增10倍!GPT-4o狂造十亿图像
奥特曼在最新的访谈中回应了吉卜力争议,谈到了对AI带来的新职业及创业公司的看法。 新职业出现的时候,经常被嘲笑。 嘲笑别人是「套壳」是件容易的事。
4/8/2025 9:38:00 AM
新智元
数学大一统的惊人胜利!天才数学家用30年破解不可能,边看《星战》边写论文
一个与「数学大一统理论」相关的领域,一项长期以来被视作几乎不可能的数学证明,如今取得了突破。 在历经30年的努力后,数学家们证明了这个数学构想——几何Langlands Program。 著名数学家、Max Planck研究所的Peter Scholze(菲尔兹奖得主,他没有参与这项证明)兴奋地表示:看到它得到解决真是太好了。
4/8/2025 9:37:00 AM
新智元
奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的
奥特曼最新访谈回应一切! 在一档播客节目中,OpenAI CEO奥特曼分享了对4o吉卜力风突然走红以及大多数创业公司都是“套壳包装”的看法,并谈到了AI编程、AI智能体等前沿技术的发展趋势。 尤其是当中提到了一个“杰文斯悖论”的典型案例——当编程成本下降时,全球对软件的需求会呈指数级增长。
4/8/2025 9:27:00 AM
量子位
清华耶鲁推理模型新范式:动态推理实现高效测试时扩展,大大节省Token消耗
推理性能提升的同时,还大大减少Token消耗! 清华、耶鲁团队提出推理模型新范式:动态推理实现高效测试时扩展。 测试时扩展(test-time scaling)技术加速推动了大语言模型在复杂推理领域的突破。
4/8/2025 9:16:00 AM
量子位
Meta 高管澄清:新 AI 模型 Llama 4 训练“作弊”传言不属实
Meta高管否认Llama 4模型通过测试集训练作弊的传言,称指控“根本不属实”。但承认不同云服务商提供的模型存在质量差异,正进行错误修复。#AI伦理##MetaAI#
4/8/2025 9:12:39 AM
远洋
首个个性化对齐大模型问世!可精准识别用户内在动机和偏好,还有百万用户画像开源数据集 | 蚂蚁&人大
如何让大模型更懂「人」? 虽然现有大模型经过了人类价值观对齐训练,但其对齐效果往往会让少数群体的声音被系统性淹没。 那随之而来的问题是,当大模型服务全球用户,标准化对齐范式是否正在制造新的数字鸿沟?
4/8/2025 9:12:00 AM
量子位
CLIP被淘汰了?LeCun谢赛宁新作,多模态训练无需语言监督更强!
最近AI圈最火的模型非GPT-4o莫属,各种风格图片持续火爆全网。 如此强悍的图片生成能力,得益于GPT-4o本身是一个原生多模态模型。 从最新发布的LLM来看,多模态已经成为绝对的主流。
4/8/2025 9:10:00 AM
新智元
中科大ICLR2025:特定领域仅用5%训练数据,知识准确率提升14%
让大语言模型更懂特定领域知识,有新招了! 来自中国科学技术大学MIRA实验室的王杰教授团队提出了提出了一个创新的框架——知识图谱驱动的监督微调(KG-SFT),该框架通过引入知识图谱(KG)来提升大语言模型(LLMs)在特定领域的知识理解和处理能力。 实验结果表明,其在多个领域和多种语言的数据集上取得了显著的效果,成功入选ICLR 2025。
4/8/2025 9:00:00 AM
量子位
亚马逊升级 AI 视频模型 Nova Reel,最长可生成两分钟多镜头视频
亚马逊AI视频模型Nova Reel升级,新版本Nova Reel 1.1可生成最长两分钟的多镜头视频,支持用户提供4000字符提示词。新增“多镜头手动”模式,结合图片和提示词生成视频。目前仅通过AWS平台提供。 #AI视频生成# #亚马逊AI#
4/8/2025 8:59:12 AM
远洋
大语言模型(LLM)是如何思考的?讲讲推动下一代人工智能推理的五种途径
译者 | 张哲刚审校 | 重楼大语言模型(LLMs)最早时期只是具备自动完成的功能,迄今为止,进步巨大,与当初已经不可同日而语。 然而,仅仅是生成流畅的文本并不足以体现真正的智能——真正的智能是需要推理能力的。 这意味着,大语言模型需要能够解决数学问题、能够调试代码、能够得出合乎逻辑的结论,还要能够检查和改正自身的错误。
4/8/2025 8:18:38 AM
张哲刚
如何对AI应用实施安全管控(带示例)
作者 | 陈峻审校 | 重楼今年初,随着DeepSeek惊艳全球,各个企业和组织都敏锐地察觉到了人工智能(AI)技术为其赋能的机遇。 虽然居多IT专业人员都认为各项数字化服务都值得用AI进行提速提效,但是相对于All in AI的狂热,信息安全技术人员有必要在保持冷静的同时,积极筹备,尽快制定出针对那些涉及AI应用的安全性管控措施。 下面,我将以自己在企业中的项目经验,依次从网络、系统、应用、模型、数据、以及合规,六个层面和你讨论一些具体、可落地的安全检查要点。
4/8/2025 8:10:03 AM
陈峻
初级开发者过度依赖 AI 的风险
当ChatGPT等工具出现故障时,软件开发人员离开工位、临时休息或沮丧地靠在椅背上的场景并不罕见。 对许多技术从业者而言,AI辅助编码工具已成为日常便利。 即便是像2025年3月24日那样的短暂中断,也可能导致开发工作停滞。
4/8/2025 8:05:00 AM
AI小蜜蜂