应用
微软推动 AI 互操作性,发布两大 MCP 服务器
Azure MCP Server为多种Azure资源提供通用访问支持,而Azure Database for PostgreSQL Flexible Server专用服务器则专注于数据库操作。这两个服务器均基于开放的MCP标准,简化开发流程,减少为不同数据源定制连接器的需求。
ChatGPT 低调上线“记忆搜索”功能:个性化搜索结果更精准
ChatGPT在进行网页搜索时,将能够结合记忆中存储的个人信息(IT之家注:例如用户过去提到的饮食偏好)来优化搜索结果。
OpenAI 新推理模型被曝产生更多“幻觉”,o3 / o4-mini 性能与错误率一同提升
根据 OpenAI 的内部测试,作为推理模型的 o3 和 o4-mini,出现幻觉的频率不仅超过了前代推理模型 o1、o1-mini 和 o3-mini,甚至还高于传统“非推理”模型(IT之家注:如 GPT-4o)。
研究称生成式 AI 背后隐藏高昂水电消耗,直接影响数据中心周边生活成本
研究发现,AI 即便仅仅是在生成文本时,背后也需要消耗大量水资源用于服务器降温,此外还伴随着庞大的电力消耗。
DeepSeek 梁文锋入选《时代》周刊“2025 年全球最具影响力 100 人”
梁文锋出现在了“Pioneers(拓荒者)”分类中。企业家名人中,AMD CEO 苏姿丰、Meta CEO 马克・扎克伯格也成功上榜,不过均在“Titans(巨人、伟人)”分类中。
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
通过这个插件,在大模型中,只需要一张图加一句话,就可以让任何角色以你想要的姿势出现在任何地方。
AMD显卡性能飞跃!Stable Diffusion 模型迎来优化大提升
AMD 在 AI 领域的进展值得关注,尤其是其最新发布的针对 Stable Diffusion 模型的优化。 近日,Stability AI 推出了基于 ONNX 框架优化的 Stable Diffusion 版本,这意味着 AMD 的 Radeon 显卡和锐龙集显在运行 AI 任务时性能提升显著,最高可达3.8倍。 这一进展不仅缩小了与 NVIDIA 在生态系统优化方面的差距,也为 AMD 用户带来了实实在在的好处。
AI大时代凝聚青年智慧,2025WAIC云帆奖持续报名中
在全球 AI 创新格局加速重塑之际,2025 WAIC 云帆奖已开启全球报名,期待汇聚更多有志于推动 AI 发展的青年力量。 从基础理论突破到产业实践创新,从跨学科交叉到开源生态建设,我们寻找能够在通往 AGI 的征途上贡献中国智慧的青年才俊。 下面,三位重量级奖项召集人向你发出诚挚邀请:WAIC 云帆奖得主赋能计划赋能计划学术影响力跃升:在 WAIC 揭晓获奖名单并颁发证书,提升获奖者国际知名度与学术影响力。
好玩!复旦与阶跃星辰联合发布SVG矢量图生成大模型OmniSVG!挑战3万Token极限
在日常生活中,SVG(可缩放矢量图形)被广泛应用于网页设计、图标、徽标等领域。 SVG 图形因其可缩放性和清晰度,在以下场景中得到了广泛应用:网页设计:用于制作响应式图标、按钮和装饰元素,确保在不同设备上显示清晰。 品牌标识:企业徽标、品牌图形等,保持高质量的视觉效果。
微软全新开源模型 MAI-DS-R1:敏感话题响应提升,安全风险降低
微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。 这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。 MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。
Blender-MCP开源发布!Claude与Blender无缝集成 自然语言控制3D创作
近日,Blender-MCP(Model Context Protocol)正式开源发布,通过将Anthropic的Claude AI与Blender无缝集成,实现了通过自然语言提示词创建复杂3D场景的突破。 据AIbase了解,该工具允许用户仅用文字描述即可生成精美3D模型,例如“低多边形龙守护宝藏”场景,极大地降低了3D建模的技术门槛。 Blender-MCP现已在GitHub上线,引发了3D艺术家与AI开发者的广泛热议。
银行科技转型加速,大模型应用深入核心业务
随着银行业在数字化型中面临的挑战与压力日益加大,越来越多的银行开始将大模型技术融入到核心业务中,而不仅仅停留在简单的聊天机器人应用上。 最新的财报数据显示,国内一些主要银行在科技投入和大模型应用方面取得了显著进展,但同时也显露出投入的分化趋势。 根据钛媒体 App 对十家主要银行的分析,包括六大国有银行及几家股份制银行,发现其中六家银行的科技投入出现了缩减。
ABBYY 推出全新 OCR API,助力开发者轻松提取文档数据
为了应对开发者在从商业文档中提取可靠数据方面日益增长的压力,ABBYY 于近日推出了 ABB Document AI™,该工具通过自助应用程序接口(API)提供服务。 ABBYY Document AI API 的设计旨在提升开发者的使用体验,用户只需通过几行代码即可轻松将非结构化的商业文档转换为结构化的高精度数据,从而简化尝试、集成、学习和购买行业领先的光学字符识别(OCR)及智能文档处理(IDP)解决方案的过程。 图源备注:图片由AI生成,图片授权服务商MidjourneyABBYY 的工程研发副总裁 Nick Hyatt 表示:“作为 OCR 领域的先锋,ABBYY 一直以来都拥有一批活跃的开发者社区,他们利用我们先进的文档 AI 创造变革性解决方案。
宇树科技新专利可用于大规模舞蹈表演,特别是民族舞
企查查APP显示,近日,杭州宇树科技有限公司“一种机器人和机器人控制方法”专利公布。 摘要显示,本发明的一种机器人,包括机器人本体和旋转表演件;机器人本体上设有用于装配旋转表演件的手臂和用于抛动表演道具的抛出电机;旋转表演件装配在手臂的末端,抛出电机能够提供抛出动力,给表演道具往外飞的动能,使得本发明的机器人至少可以表演旋转、抛动等舞蹈动作,动作丰富,运行演示效果好,表演性能好,创新性很强,姿态美观,拟人效果好,功能强大,可观赏性强,便于机器人的推广应用,填补了机器人表演技术的空白,可用于大规模人形机器人舞蹈表演,特别是可以进行民族舞表演。
腾讯云突破性升级!大模型知识引擎首家接入MCP,AI应用开发迎来新时代
在成都春光明媚的四月,一场关乎中国AI技术发展的重要突破悄然揭晓。 2025腾讯全球数字生态大会成都峰会于4月18日盛大开幕,腾讯云智能区域解决方案总监王伟带来了一个振奋人心的消息:腾讯云大模型知识引擎已成为业内首个正式接入MCP的平台。 这一技术突破意味着开发者和企业用户在构建AI应用时,将享受到前所未有的便捷体验。
年后完成第四轮融资,智谱再获北京人工智能产业投资基金 2 亿追投
4 月 16 日,北京市人工智能产业投资基金宣布在去年已有投资基础上,继续追加投资智谱(Z.ai)2 亿元人民币,支持智谱的开源模型研发与开源社区生态建设。
别再只玩ChatGPT了!OpenAI悄悄发布《构建 Agent 实战指南》 手把手教你打造智能体
OpenAI 最近悄悄发布了一份 《构建 Agent 实战指南》 (A practical guide to building agents),简直就是一份“AI 打工人”的养成手册!今天,老司机我就带你用最接地气、最有趣的方式,把这份官方秘籍给你扒个底朝天,让你也能轻松 Get 打造专属 AI Agent 的精髓!准备好了吗?发车!等等,Agent 到底是个啥玩意儿?跟普通软件有啥不一样?咱们先搞清楚,Agent 不是你手机里那些按部就班执行命令的 App,也不是只会简单聊天的机器人。 OpenAI 给它下了个定义:Agent 是能独立自主地、代表你完成特定任务的系统。 划重点:独立自主!想想你平时用的软件,比如订票 App,你得一步步告诉它去哪儿、啥时候、坐啥舱位,它才给你结果。
Midjourney图像编辑器重磅更新,新图层功能、智能选择工具
Midjourney宣布对其图像编辑器进行重大更新,引入了焕然一新的用户界面(UI)、图层功能、智能选择工具以及更智能的审核系统。 这一更新不仅优化了用户体验,还显著提升了AI图像编辑的灵活性与精准度,进一步巩固了Midjourney在AI艺术生成领域的领先地位。 焕新UI:更直观的操作体验Midjourney图像编辑器此次更新的一大亮点是全新设计的用户界面。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉