资讯列表
机械臂+大模型+多模态:打造人机协作具身智能体
在人工智能快速发展的浪潮中,多模态大模型已成为技术前沿,使AI能够同时理解文本、图像、音频等多种信息。 这一突破为具身智能体开辟了新天地。 最近我在github中就找到了一个这样好玩的项目vlm_arm,其将机械臂与多模态大模型结合,打造一个能听人话、看图像、执行精准操作的人机协作智能体系统。
4/25/2025 2:30:00 AM
贝塔街的万事屋
基于MiniO存储的RAGFlow+Dify图片处理方案
上篇文章中介绍了如何基于 RAGFlow 知识库,通过 Dify 的 HTTP 请求获取映射 Code 节点替换,将占位符解析为最终的 img 标签,来稳定的实现问答中图片正常显示问题。 Dify RAGFLow:基于占位符的图片问答升级方案(最佳实践)其中的"占位符"和"实际图片访问 URL"映射关系的存储使用了阿里云的 OSS 存储服务。 初期选择阿里云 OSS 作为存储,主要是方便大家快速验证和迭代 RAG 应用的核心逻辑,避免过早陷入基础设施的维护细节。
4/25/2025 1:30:00 AM
韦东东
智能体的五大商业用例
AI的下一代已经到来,它具有自主性。 智能体与聊天机器人由相同的AI系统提供支持,但可以独立行动、协作以实现更大的目标,并接管整个业务流程,这项技术相对较新,但所有主要参与者都已经加入。 去年10月,微软宣布包括标准银行、路透社、Virgin Money和苏黎世保险在内的10万家组织正在使用Copilot .
4/25/2025 1:10:00 AM
Maria
喂饭级教程!如何用AI制作动态表情包+上架微信
嗨大家好! 原本今天真的肝不动了,但是没想到昨天放了最后尝试的几个动态表情大家都这么感兴趣制作方法,于是我一个鹞子翻身起来继续给读者老爷们拆解动态表情包制作! (哦,怎么又是下一天了).
4/25/2025 1:07:00 AM
阿真Irene
DeepSeek在数据领域的30个应用场景
在这个数据AI的时代,DeepSeek作为新一代AI模型正在改变我们处理、分析和理解数据的方式。 本文为您揭秘DeepSeek在数据领域的30个颠覆性应用场景,带大家一窥AI如何重塑数据价值链。 一、数据获取与处理篇1.
4/25/2025 12:50:00 AM
大数据AI智能圈
揭秘大模型的魔法:训练你的tokenizer
大家好,我是写代码的中年人。 在这个人人谈论“Token量”、“百万上下文”、“按Token计费”的AI时代,“Tokenizer(分词器)”这个词频频出现在开发者和研究者的视野中。 它是连接自然语言与神经网络之间的一座桥梁,是大模型运行逻辑中至关重要的一环。
4/25/2025 12:20:00 AM
写代码的中年人
可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用
Adobe 推出全新应用 Content Authenticity,用于保护创意工作者的作品署名权,即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试,用户上传需要保护的图像,应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签,帮助确认作品归属和保护作品免遭 AI 训练。
4/24/2025 9:32:18 PM
准泽(实习)
Windsurf全面降价!编程赛道的价格战要来了;被OpenAI收购尚未证实
编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)刚刚得到消息,AI编码助手初创公司 Windsurf周一宣布“全面”降价,称随着与竞争对手 Cursor 的竞争加剧,用户可以“大幅节省成本”。 Windsurf 表示,它将放弃其复杂的“流程操作积分”系统,该系统会向开发者收取其 AI 在后台执行的操作的费用。 此外,该公司还将team plans的价格从每位用户每月 35 美元降至 30 美元,同时其企业计划的价格也将“大幅降低”。
4/24/2025 6:40:17 PM
云昭
阿里妈妈:天猫618期间将投入三大AI红利
在日前召开的 “质赢618・增长策略发布会” 上,阿里妈妈宣布了一系列新举措,以推动天猫618购物节的成功。 此次活动将利用三大 AI 红利,并结合30亿红包等多重激励,旨在全面提升品牌的市场表现,并贯彻 “扶优扶新” 的平台战略。 阿里妈妈表示,将通过其先进的 AIGX 能力,全面提高营销效率,助力商家在全域范围内提升品牌影响力。
4/24/2025 6:00:47 PM
AI在线
Perplexity 推出全新 iOS AI 语音助手
近日,AI 技术公司 Perplexity 在官方渠道上宣布推出一款全新的 AI 语音助手,专为 iOS 平台用户设计。 这款助手旨在为用户提供与苹果原生的 Siri 相似的使用体验,力求在生活和工作中带来更多便利。 Perplexity 的 AI 助手具备强大的功能,用户可以通过语音指令轻松实现网页浏览和多款应用的操作。
4/24/2025 6:00:46 PM
AI在线
即梦3.0海外版发布,电影级视觉与精准英文排版引领AI创作新高度
字节跳动旗下即梦AI(Jimeng AI)正式推出即梦3.0海外版本,标志着其文本到图像与视频生成技术向全球市场的进一步扩展。 据AIbase了解,新版本以电影级画面品质、2K分辨率输出、超逼真材质与精准英文排版为核心亮点,尤其在英文文本生成与字体控制上表现卓越,超越此前中文版本的效果。 发布消息已在社交平台引发热烈讨论,相关功能可通过即梦官网与移动应用体验。
4/24/2025 6:00:46 PM
AI在线
AI日报: OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占全球AI专利60%
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:、OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能OpenAI最近推出了gpt-image-1图像生成API,开发者可以将这一先进技术轻松集成到各种应用中。 这一功能自上线以来,吸引了大量用户,生成了超过7亿张图像。
4/24/2025 5:00:46 PM
AI在线
工信部等七部门:支持医院药企积极引入 AI、开展“人工智能赋能医药全产业链”应用试点
今日工业和信息化部等七部门印发《医药工业数智化转型实施方案(2025—2030 年)》,主要提出一系列政策,鼓励医院药企积极引入 AI 人工智能。《实施方案》提到,有关部门将支持相关单位建立医药大模型创新平台,协同开展医药大模型技术产品研发、监管科学研究等,强化标准规范、科技伦理、应用安全和风险管理等规则建设。
4/24/2025 4:41:42 PM
漾仔
谷歌I/O2025展望:Material3、Android XR与生成式AI重塑开发者体验
在今天上午的谷歌I/O2025会议上,谷歌宣布了一系列令人激动的新技术,进一步展示了其在人工智能、沉浸式体验和开发工具方面的最新进展。 以下是我们可以期待的主要亮点:1. Material3Expressive:情感化设计的未来谷歌将在此次大会上推出Material3Expressive,这一全新设计系统被形容为“谷歌用户体验设计的未来”。
4/24/2025 3:00:47 PM
AI在线
红杉投资AI初创公司Listen Labs筹集2700万美元,颠覆市场研究行业
近日,红杉资本投资的人工智能初创公司Listen Labs宣布,已成功筹集到2700万美元的融资,旨在颠覆传统的市场研究行业。 公司通过创新的人工智能技术,实现了在数千个语音访谈中同时进行客户研究,极大提升了调研效率和精度。 AI驱动的语音访谈,打破市场研究的时间与成本壁垒Listen Labs的核心技术依赖于先进的人工智能模型,能够在短短几小时内完成传统市场研究方法数天甚至数周才能完成的工作。
4/24/2025 3:00:47 PM
AI在线
营收目标增长近10倍!创新医疗AI大模型商业化提速,明年剑指4000万
近日,创新医疗在一场备受关注的业绩说明会上,公布了其全诊AI医疗大模型的最新进展和雄心勃勃的商业化目标。 据创新医疗在4月23日业绩说明会上透露的信息,其核心产品——全诊AI医疗大模型,在商业化方面正展现出强劲的增长势头。 数据显示,该模型在2024年(剔除基层HIS业务收入后)实现了440万元的收入。
4/24/2025 3:00:47 PM
AI在线
卓驭科技成功接入阿里通义大模型,推动智能驾驶技术发展
在最新的上海车展上,卓驭科技(简称 “卓驭”)宣布其已成功接入阿里通义大模型,这一举措标志着其在智能驾驶领域的又一重要进展。 作为智驾驾驶供应商及服务商,卓驭借助阿里云的强大计算能力,致力于构建一个端到端的智能驾驶世界模型,以提升汽车的智能化水平。 近年来,智能驾驶技术得到了快速发展,各大汽车制造商纷纷加大在这一领域的投入。
4/24/2025 3:00:46 PM
AI在线
谷歌“Wi-Fi密码”式的最瘦大模型
Gemma 3 的“低门槛 AI”计划露面了,谷歌这次直接把 Gemma 3 做成了“跑得动的”AI。 —Gemma-3-27b-it-qat-q4_0-gguf 听上去像个 Wi-Fi 密码,其实却是谷歌迄今为止最精简的大模型是的,不再只属于高端服务器和土豪显卡,普通玩家的游戏卡,甚至手机,都能一试身手。 这波操作的核心是三个字:量化训练(Quantization-Aware Training, QAT)。
4/24/2025 2:13:00 PM
文摘菌