资讯列表
从文本生成到指令编辑 OmniGen2重塑开源多模态模型应用场景
近日,VectorSpaceLab在Hugging Face平台正式开源全能多模态模型OmniGen2,以创新性双组件架构和强大的视觉处理能力,为研究者和开发者提供了高效的可控生成式AI基础工具。 这款模型由30亿参数的视觉语言模型(VLM)Qwen-VL-2.5与40亿参数的扩散模型组合而成,通过冻结的VLM解析视觉信号和用户指令,结合扩散模型实现高质量图像生成,在视觉理解、文本生成图像、指令引导图像编辑和上下文生成四大核心场景中展现出领先性能。 作为开源项目,OmniGen2的视觉理解能力继承自Qwen-VL-2.5的强大基础,可精准解析图像内容;其文本生成图像功能支持从文本提示生成高保真、符合美学标准的图像;在指令引导图像编辑领域,该模型以高精度完成复杂修改任务,性能达到开源模型中的前沿水平;而上下文生成能力更可灵活处理人物、物体、场景等多元输入,生成连贯新颖的视觉输出。
6/24/2025 11:00:41 AM
AI在线
Salesforce 发布 Agentforce 3:实现 AI 代理实时监控 MCP 支持
近日,Salesforce 推出了其 AI 代理平台的重大升级 ——Agentforce3,旨在帮助企业更好地应对在大规模部署数字化工作者时面临的主要挑战。 此次更新引入了一个全新的 “指挥中心”,使高管能够实时监控 AI 代理的表现,同时支持多种互操作性标准,允许代理与数百种外部业务工具无缝连接,而无需进行定制编码。 根据 Salesforce 的数据,过去六个月中,AI 代理的使用量激增了233%,已有超过8000家客户注册使用这一技术。
6/24/2025 11:00:41 AM
AI在线
谷歌 Google Cloud 向 Linux 基金会捐赠 A2A 智能体交互协议
Google Cloud 在 A2A 领域的下一步是通过与外部合作,制定一套更广泛的开放标准,丰富 A2A 协议的功能集。
6/24/2025 10:41:37 AM
溯波(实习)
ElevenLabs隆重推出AI语音助理11ai:语音优先并支持集成MCP
ElevenLabs正式发布其全新语音优先AI个人助理11ai,标志着语音AI技术在生产力工具领域的又一重大突破。 作为一家以创新文本转语音和对话AI技术闻名的公司,ElevenLabs此次推出的11ai不仅集成了前沿的语音交互功能,还通过多工具集成和自定义MCP(多通道协议)支持,为用户提供了高度个性化的工作流体验。 语音优先,生产力为核心11ai以语音交互为核心设计,旨在通过自然、流畅的对话提升用户的工作效率。
6/24/2025 10:00:51 AM
AI在线
英国数据中心面临 AI 可持续发展挑战
随着人工智能的快速发展,数据中心基础设施面临前所未有的压力,尤其是在电力供应和可持续性方面。 最近,在一次行业圆桌会议上,专家们讨论了英国数据中心行业所面临的重大挑战,尤其是在支持 AI 创新的同时,如何维持环境承诺。 图源备注:图片由AI生成,图片授权服务商MidjourneySalute 公司 EMEA 地区销售与解决方案副总裁理查德・克利福德指出,“我们最大的挑战之一是电力的可用性及其可供给的时间。
6/24/2025 10:00:51 AM
AI在线
Grok Web即将推出“文件”选项卡,整合多类型文件管理
xAI开发的Grok Web即将推出全新“文件”选项卡,为用户提供一站式文件管理体验。 该功能将整合图像、电子表格、文本和代码等多种文件类型,显著提升工作效率与便捷性。 新功能支持用户在一个统一界面内浏览、创建、上传和编辑文件。
6/24/2025 10:00:51 AM
AI在线
AI 逆袭:大型语言模型助力癌症新药研发,竟然能 “发明” 疗法!
近日,一项来自剑桥大学等机构的研究成果引发了广泛关注:大型语言模型(LLMs)不仅在自然语言处理领域崭露头角,还能为癌症治疗带来新的希望。 研究人员利用 GPT-4模型,首次尝试将其作为科学假说的生成工具,在乳腺癌的药物研发上取得了令人振奋的进展。 在这项研究中,团队的目标是找到能够有效对抗乳腺癌的新药物组合。
6/24/2025 10:00:51 AM
AI在线
迪士尼向AI侵权者“开战”:Midjourney首当其冲,法律战火升级
迪士尼正对其版权角色的未经许可AI使用行为采取强硬法律行动,首席法律官奥拉西奥·古铁雷斯透露,近期对图像生成器Midjourney的诉讼只是这场知识产权保卫战的序幕。 此举标志着迪士尼在生成式AI领域捍卫其宝贵IP的决心。 迪士尼对Midjourney的首次起诉,源于该公司无视多次删除涉及达斯·维达等角色的内容请求。
6/24/2025 10:00:51 AM
AI在线
微软发布创新小参数模型Mu:性能比肩Phi-3.5-mini,赋能Windows智能体
今天凌晨,微软正式发布了其最新创新小参数模型Mu。 这款模型参数仅为3.3亿,却在性能上能与微软此前发布的Phi-3.5-mini相媲美,而其体量仅为Phi-3.5-mini的十分之一。 更令人瞩目的是,Mu在离线NPU笔记本设备上能实现每秒超过100个token的响应速度,这在小参数模型领域是极为罕见的突破。
6/24/2025 10:00:51 AM
AI在线
OpenAI惊爆抄袭丑闻?65亿美元收购Jony Ive公司IO,背后暗藏IYO智能耳塞技术之争!
近日,人工智能领域掀起了一场轰动性的争议风暴。 谷歌X实验室分拆出来的初创公司IYO指控OpenAI及其首席执行官Sam Altman涉嫌抄袭其智能耳塞技术,并通过以65亿美元收购Jony Ive的公司IO,试图掩盖这一行为。 IYO指控:OpenAI涉嫌窃取智能耳塞技术IYO是一家自2018年起专注于研发人工智能驱动智能耳塞的初创公司,其产品旨在通过语音控制和无屏幕交互技术,取代传统智能设备。
6/24/2025 10:00:51 AM
AI在线
携程机票前端Web流式通信SSE全链路应用实践
作者简介Chris Xia,携程前端开发专家,关注新技术革新和研发效率提升。 本文介绍了携程机票前端基于Server-Sent Events(SSE)实现服务端推送的企业级全链路通用技术解决方案。 深入探讨 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节,为类似使用场景提供普适性参考和借鉴。
6/24/2025 9:51:47 AM
Chris Xia
RAG系列:切分优化 - 基于句子余弦距离的语义切分
引言传统的文档切分方法通常采用基于特定字符和固定长度的切分策略,这种方法虽然实现简单,但在实际应用中容易割裂完整的语义单元,导致后续的信息检索与理解受到影响。 相比之下,一种更智能的切分方法是基于句子余弦距离的语义切分。 它不再依据特定字符和固定长度进行机械切分,而是对每个句子进行 embedding,以此来计算相邻句子的余弦距离,再通过算法算出一个相对合理的切分点(某个距离值),最后将不大于该阈值的相邻句子聚合在一起作为一个文档块,从而实现文档语义切分。
6/24/2025 9:51:10 AM
燃哥讲AI
消息称三星计划第三季度公布 Galaxy AI 定价策略,视频生成等高级 AI 功能将付费
三星或将在第三季度公布Galaxy AI收费策略,视频生成等高级功能可能需付费使用。此前官方承诺今年内免费,但后续收费计划一直未明确。#三星AI收费# #GalaxyAI#
6/24/2025 9:20:46 AM
漾仔
特斯拉Robotaxi终于来了,但这11个误区你得先搞清楚
6月22日,特斯拉在奥斯汀正式启动了Robotaxi服务。 我在推特上看到那些邀请函截图时,说实话有点震惊——这个被马斯克承诺了无数次的服务,居然真的开始了。 不过,网上关于特斯拉Robotaxi的讨论,很多都是错误的。
6/24/2025 9:16:48 AM
阿丸笔记
微软刚发布Mu模型:支持Windows智能体,小参数跑出10倍性能
今天凌晨,微软在官网发布了创新小参数模型Mu。 Mu仅有3.3亿参数,但其性能可以比肩微软之前发布的小参数模型Phi-3.5-mini,体量却比它小10倍左右,并且在离线NPU的笔记本设备上,可以跑出每秒超过100 tokens的响应,这在小参数模型领域非常罕见。 此外,Mu支持在Windows中设置智能体,可将自然语言指令实时转化为系统操作,例如,只需对着电脑说一句 “把鼠标指针调大一些,调整屏幕亮度”,智能体就能精准定位到相关设置项一键完成调整。
6/24/2025 9:08:31 AM
AI真的需要「像人类」那样思考吗?AlphaOne揭示属于大模型的「思考之道」
本文共同第一作者为张均瑜与董润沛,分别为伊利诺伊大学厄巴纳-香槟分校计算机科学研究生与博士生;该研究工作在伊利诺伊大学厄巴纳-香槟分校张欢教授与 Saurabh Gupta 教授,加州大学伯克利分校 Jitendra Malik 教授的指导下完成。 「The most effortful forms of slow thinking are those that require you to think fast.」 ——Daniel Kahneman,Thinking,Fast and Slow(2011)在思维节奏这件事上,人类早已形成一种独特而复杂的模式。 我们习惯让 AI 模仿人类思维方式:先依赖直觉快速反应(System 1),再慢慢进入逻辑推理(System 2);答题时先给出初步判断,再自我反思逐步修正……模仿人类的推理节奏,已经成为语言模型推理策略的默认路径。
6/24/2025 9:05:00 AM
28岁辍学生掌舵Meta超级AI!小扎掷千亿,与奥特曼密谋,新「王」登顶
19岁MIT辍学,24岁白手起家的亿万富翁,扎克伯格为他豪掷143亿美元,28岁掌管Meta新设立的「超级智能」部门。 这些标签哪一个都足够让人侧目,但汇聚在Alexandr Wang身上,却只是他AI「登月计划」的起点。 最近,这位Scale AI创始人宣布辞去CEO职位,正式加盟Meta,挑起打造超越人类智能AI的重任。
6/24/2025 9:04:21 AM
哈佛重磅预警!经济学家预言:全球AI失业潮2年来袭,世界经济大崩盘在即
AI接管全员工作,这个话题彻底火了。 甚至连哈佛商学院都做了一个Youtube视频,预警如果AI接管人类的所有工作时,将会发生什么。 在访谈中,弗吉尼亚大学经济学教授、领先的AI经济学家 Anton Korinek揭示了为何AGI可能在短短2-5年内实现。
6/24/2025 9:01:57 AM