AI在线 AI在线

资讯列表

Encoder-free无编码器多模态大模型EVEv2模型架构、训练方法浅尝

基于视觉编码器的MLLM的基本构成:MLLM通常由预训练的模态编码器、预训练的LLM和一个连接它们的模态接口三个模块组成。 模态编码器(如:CLIP-ViT视觉编码器、Whisper音频编码器等)将原始信息(如图像或音频)压缩成更紧凑的表示。 预训练的LLM则负责理解和推理处理过的信号。
4/28/2025 2:03:00 AM
余俊晖

o3猜照片位置深度思考6分48秒全程高能,范围精确到“这么近那么美”

ChatGPT新玩法,让程序员大佬Simon Willison直呼太反乌托邦了,像科幻突然变成现实:只需一张照片,靠带图深度思考就能猜出地理位置。 图片这种玩法很简单,随手拍一张风景,没有任何明显的地标即可,也不需要复杂的提示词,只需要问“猜猜这张照片是在哪里拍的? ”(需要o3/o4-mini的带图思考,先关闭所有记忆功能)。
4/28/2025 1:01:00 AM

样机素材不够用?教你用AI工具实现无限样机!

本文为你详解AI工具生成4K样机全流程,涵盖豆包/Liblib生图技巧和PS处理方法,附赠黄金提示词。 更多样机提示词:. 设计素材不用愁!
4/28/2025 12:02:03 AM
Alex

MCP 服务器很危险!这里有安全使用指南!

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP 这次真的火了! 自从Anthropic于 2024 年 11 月推出以来,它有望成为“将 AI 助手连接到数据所在系统的新标准”。 截至目前,该协议已被 OpenAI、微软和谷歌等公司迅速采用;各大供应商纷纷推出 MCP 服务器,希望在 AI 代理工作流程中不失时机。
4/27/2025 7:37:31 PM
云昭

优必选签署小批量人形机器人采购合同,将用于汽车工厂等

优必选与多家车企签订人形机器人采购合同,Walker S1和Walker C将用于汽车制造和商用接待,标志着人形机器人在工业场景的首次批量应用。#人形机器人##工业自动化#
4/27/2025 7:07:52 PM
浩渺

从“天书”到“维基百科”:DeepWiki一键让GitHub代码库变身交互式知识库!

Cognition Labs推出了一款名为DeepWiki的创新工具,旨在将任意GitHub公共代码库一键转化为详细易懂的知识库文档,并提供交互式图表与对话式AI助手支持。 据AIbase了解,DeepWiki通过分析代码、README和配置文件,自动生成结构化文档,用户可通过自然语言提问获取技术、架构或使用方法的精准解答。 社交平台上的热烈反响凸显了其颠覆性潜力,相关功能已通过DeepWiki官网(deepwiki.com)免费开放。
4/27/2025 6:00:38 PM
AI在线

国内首个多模态AI程序员正式上岗 文心快码Coding智能体Zulu正式发布

2025年4月25日,百度Create AI开发者大会在北京隆重举行。 在这场备受瞩目的科技盛会中,百度正式发布了文心快码3.5版本以及国内首个多模态AI程序员——文心快码Comate Zulu智能体,标志着AI编程工具进入了一个全新的发展阶段。 在本次大会上,百度工程效能部总监臧志表示,AI是百度提升工程效率最重要的生产力来源,智能体是大模型能力与研发生产力之间最关键的桥梁。
4/27/2025 6:00:38 PM
AI在线

谷歌在垄断审判中被曝向三星支付巨款预装Gemini应用

据彭博社报道,正在进行的谷歌反垄断审判本周的证词显示,谷歌每月向三星支付“巨额资金”,以在其设备上预装其Gemini人工智能应用程序。 这一信息正值法官阿米特·梅塔(Amit Mehta)已裁定谷歌的搜索引擎构成非法垄断之后,目前谷歌的律师正与美国司法部就潜在的处罚力度展开辩论。 谷歌平台和设备合作副总裁彼得·菲茨杰拉德周一作证称,谷歌与三星之间的这笔付款协议始于今年1月份。
4/27/2025 6:00:38 PM
AI在线

字节跳动启动 Top Seed 大模型顶尖人才计划 2026 届校招,计划招募 30 位顶尖博士

字节跳动正式启动2026届Top Seed校招,计划招募30位顶尖博士,研究方向涵盖大语言模型、多模态生成等前沿领域。不限专业背景,更看重研究潜力与热情。#字节跳动校招# #大模型人才#
4/27/2025 5:56:06 PM
远洋

GPT-4o图像生成能力集成GPTs,开启个性化图像机器人新篇章

OpenAI宣布GPT-4o的图像生成能力正式集成到GPTs(自定义GPT)平台,为开发者与创作者提供了构建个性化图像生成机器人的强大工具。 据AIbase了解,这一更新允许用户通过GPTs打造专属图像生成应用,如海报设计机器人或特定艺术风格生成器,极大地提升了创作灵活性与共享性。 社交平台上的热烈讨论凸显了其广泛影响力,相关功能已向ChatGPT Plus、Pro及Team用户开放。
4/27/2025 5:00:38 PM
AI在线

GPT-4o偷偷升级,变身聊天鬼才!新版STEM智力飙升,生图却惨遭削弱?

OpenAI又默默地更新了模型。 前一天,奥特曼发文称更新后的GPT-4o,在智力和个性方面有了很大的提升。 图片在更新公告中,GPT-4o还优化了保存记忆的时间,增强了STEM领域问题解决能力。
4/27/2025 3:40:02 PM
新智元

智谱与生数科技达成战略合作 专注大模型联合创新

4月27日,清华大学旗下的两家明星人工智能公司智谱(Z.ai)和生数科技(shengshu.com)宣布达成重大战略合作。 此次合作旨在通过双方在大语言模型和多模态生成模型的技术积累与优势,共同推进国产大模型的技术创新与产业落地。 智谱和生数科技的合作涵盖了联合研发、产品联动、解决方案整合以及行业协同等多个方面。
4/27/2025 3:00:38 PM
AI在线

蚂蚁OceanBase 发布全员信:CTO杨传辉担任AI一号位 瞄准AI数据底座

蚂蚁集团旗下分布式数据库OceanBase今日宣布了一项重大人才和组织体系升级,旨在全力保障公司AI战略的高效落地。 OceanBase CEO杨冰在全员信中透露了这一决定。 根据全员信内容,OceanBase CTO杨传辉将担任公司AI战略的“一号位”,全面统筹AI战略的制定以及相关技术和产品的落地实施。
4/27/2025 3:00:38 PM
AI在线

答对有资格入职特斯拉?马斯克这道数学题,我们用七大 AI 模型测了一遍

此前,马斯克在社交平台 X 上贴出了一道数学题,并表示如果有人解开这个问题,就有资格在特斯拉公司工作,引起了很多网友的讨论
4/27/2025 2:57:01 PM
汐元

通付盾CRM智能体“招财猫”,AI Agent助力企业销售智能化

传统CRM系统因数据分散、销售人员难以管理、客户隐私数据担忧、缺乏智能分析等痛点,很难满足企业高效管理客户关系与提升业务绩效的需求。 大语言模型和Agent技术的蓬勃发展,让智能CRM时代真正到来,实现从线索获取到客户转化、项目管理及财务数据处理的全流程自动化,提升企业运营效率,创造增量价值。 通付盾CRM智能体“招财猫”—————————————————AI Agent助力企业销售智能化通付盾推出CRM智能体(CRM Agent),代号“招财猫(CAT)”,助力企业从销售线索到客户成单全程智能化。
4/27/2025 2:00:49 PM
AI在线

夸克AI超级框升级 上线“拍照问夸克”功能:啥都能答

4月25日,阿里巴巴旗下的夸克AI超级框宣布推出一项创新功能——“拍照问夸克”。 这一新功能基于先进的视觉理解和思考推理模型,能够更精准地理解和回答用户在物理世界中遇到的各类问题。 在日常生活中,用户常常会遇到难以用文字准确描述的情况,尤其是在面对复杂的物体、表格和图形时。
4/27/2025 2:00:49 PM
AI在线

​清华大学成立人工智能医院 迈向智慧医疗新篇章

清华大学正式成立人工智能医院,标志着该校在 “AI 医疗” 领域迈出了重要一步。 4月26日,清华大学举行了人工智能医院的揭牌仪式,并在医学院全体教职工大会上进行了相关介绍。 校长李路明、副校长王宏伟等多位领导出席了此次仪式,共同见证了这一历史性时刻。
4/27/2025 2:00:49 PM
AI在线

​夸克 AI 超级框全新上线 “拍照问夸克” 功能

阿里巴巴旗下的夸克 AI 超级框正式推出了一项名为 “拍照问夸克” 的全新功能。 这一功能的亮点在于,它能够通过 AI 相机识别图像中的人物、物体以及其他细节,进而回答用户在现实生活中的各种问题。 这项技术基于先进的视觉理解与推理能力,使得用户不再需要用复杂的语言描述需求,只需简单拍照即可。
4/27/2025 2:00:48 PM
AI在线