AI
昆仑万维面向全球发布天工超级智能体Skywork Super Agents
5月22日,昆仑万维集团面向全球市场正式发布了天工超级智能体(Skywork Super Agents)。 这款产品采用AI agent架构和deep research技术,能够一站式生成文档、PPT、表格、网页、播客和音视频等多种内容,标志着“AI版Office”时代的到来。 天工超级智能体的发布,代表了中国在AI技术领域的重大突破。
OpenAI以65亿美元收购Jony Ive创立的初创公司io,迈向AI硬件新纪元
近日,彭博社报道,OpenAI 宣布以接近65亿美元的全股票交易收购了由前苹果首席设计师 Jony Ive 联合创立的 AI 设备初创公司 io。 这项交易不仅是 OpenAI 历史上最大的一笔收购,也标志着其在 AI 硬件领域的一次重大布局。 io 公司是 Jony Ive 与几位苹果老同事共同创立的,旨在推动创新的消费电子产品。
如何基于自定义MCP服务器构建支持工具调用的Llama智能体(含code)
一、背景与目标:从知识隔离到本地化智能体在人工智能应用日益普及的今天,隐私保护与数据主权成为重要挑战。 传统的AI模型依赖外部服务,导致私有知识面临泄露风险。 本文将详细介绍如何构建一个完全本地化的AI智能体,通过自定义的Model Context Protocol(MCP)服务器实现知识隔离,并结合Llama 3.2轻量级模型实现工具调用能力。
MIT 新研究指出 AI 不懂“no”,逻辑推理缺陷导致否定词成“盲区”
研究表明,AI 已快速发展,具备诊断疾病、创作诗歌甚至驾驶汽车等多项实用技能,但对“no”和“not”等否定词,却束手无策。
100行代码速通Agent开发
大家好,我卡颂自从23年初GPT爆火后,每年都会涌现一些爆火的AI概念。 今年最火的概念无疑是Agent。 伴随而来的,是各家都在争夺「Agent的解释权」:openAI发布a-practical-guide-to-building-agents[1]Antropic发布building-effective-agents[2]langchain作者发文how-to-think-about-agent-frameworks[3]反驳openAI的观点(目的是推销自家的langGraph)这些繁杂的信息无疑加深了开发者对Agent的理解成本。
前端 x AI:基于Ollama、DeepSeek、Chroma、LangChain搭建AI应用开发框架
“纸上得来终觉浅,绝知此事要躬行”,因此学习的过程讲究“口到、手到、心到”,为避免浮于表面,需要通过实践进一步将理论内化为个人能力。 为了后续更好的在本地实践 AI 应用开发,今天我先带你在本地搭建基于 Ollama[1]、DeepSeek[2]、Chroma[3]、LangChain.js[4] 和 Next.js[5] 的全栈 AI 应用开发框架。 本开发框架秉承开源、轻量、易操作的理念,让你用最少的资源在本地进行 AI 应用开发实践,带你轻松踏入 AI 应用开发的大门。
前端 x AI:从了解提示工程、RAG和微调开始
在AI工程应用中有三种应用范式,他们分别是提示工程(Prompt Engineering)、RAG(Retrieve Augmented Generation)、微调(Fine Tuning),那么在工程应用中我们该如何选择呢? 在具体介绍这三种范式之前,首先我们需要了解什么是大模型。 大模型通常指的是拥有大量参数和复杂结构的深度学习模型,它经过海量的多样化的数据预训练之后,具备了非常多的能力,包括编码、数学、金融、教育和法律等行业的能力。
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
大模型浪潮下,你的 AI 应用遇到瓶颈了吗? 当 GPT、Claude、文心一言等各类强大模型如繁星般涌现,我们惊喜于它们令人惊叹的能力。 然而,在实际落地中,我们常常发现,即使是最顶尖的单一模型,也难以完美应对所有复杂场景的需求。
英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界
近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。 随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。 物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。
谷歌推出 MedGemma AI 模型:医疗图像与文本分析的革命性工具
在刚刚结束的2025年 I/O 开发者大会上,谷歌宣布开源全新医疗 AI 模型 ——MedGemma。 这款基于 Gemma3架构的模型专为医疗领域设计,具备强大的多模态图像和文本理解能力,旨在提升医疗诊断与治疗效率。 MedGemma 提供两种配置选项,分别为4B 和27B 参数模型。
因违法违规收集使用个人信息 Kimi等多款AI应用软件被通报
根据国家网络与信息安全信息通报中心日前通报,经公安部计算机信息系统安全产品质量监督检验中心检测,在应用宝中35款移动应用存在违法违规收集使用个人信息情况。 其中包括《Kimi》《智谱清言》《AI智能秘书》《AI剪辑》等多款AI软件。 图源备注:图片由AI生成,图片授权服务商Midjourney35款被通报的应用具体情况如下:1、未以结构化清单的方式逐一列出收集、使用个人信息规则。
面壁智能再获数亿元融资,推动AI技术落地汽车行业
5月21日,大模型创业公司面壁智能宣布成功完成新一轮融资,金额高达数亿元。 这轮融资由洪泰基金、国中资本、清控金信和茅台基金共同投资。 虽然面壁智能并未公开具体的融资额和估值,但公司表示,此次资金的注入将显著提升其大模型技术和产品壁垒,并加速在各行业的应用落地,尤其是在汽车领域。
百度再发力!李彦宏:未来5年 再为社会培养1000万AI人才
百度创始人李彦宏近日在一场发布会上宣布,未来五年,百度将继续加大力度,再为社会培养1000万名人工智能(AI)人才。 这一声明引起了广泛关注,标志着百度在推动 AI 人才发展方面的坚定决心。 据悉,百度在2020年曾提出一项目标,计划在五年内培养500万名 AI 人才,并于2024年提前完成了这一目标。
星纪魅族预告新一代AI眼镜:支持眼动追踪与AI识脸,进军智能穿戴新战场
5月20日晚,星纪魅族官方发布预告视频,首次揭晓其下一代AI眼镜StarV的部分功能,展示了这款智能穿戴设备在AI视觉交互方面的进一步升级。 据预告内容,新一代StarV AI眼镜将支持眼球追踪、AI人脸识别、拍照与扫码支付等多项功能,表明其在感知交互、支付便利性和视觉AI处理能力上实现突破。 这些功能预示着设备将不仅是信息显示终端,更将成为具备主动感知与处理能力的智能助手。
英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识
英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。
谷歌开源 MedGemma AI 模型,医疗图像与文本分析神器
MedGemma 基于 Gemma 3 架构,提供 4B 参数的多模态模型(分类)和 27B 参数的纯文本模型两种配置,4B 模型擅长分类和解读医疗图像,可生成诊断报告或解答图像相关问题;27B 模型则擅长临床文本,支持患者分诊和决策辅助。
谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI
今天召开的 2025 年 I/O 开发者大会上,谷歌推出了 Gemma 3n 端侧多模态 AI 模型,可以在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型。
DeepSeek-V3新论文:软硬协同,砸碎“算力神话”!
当AI大模型越来越“吃”硬件,把内存、算力、带宽逼到极限,追赶者们,或者说整个行业,除了干等硬件升级,还能怎么办? ChatGPT横空出世,大模型竞赛白热化。 英伟达的GPU成了硬通货,算力就是一切。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
AI新词
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
大型语言模型
生成式AI
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Transformer
Copilot
架构
MCP
编程
视觉