理论
刚刚,Qwen3强势登顶,成开源新王!国内首个混合推理模型,235B击败R1、o1!源神火力全开:全系列8个模型一口气开源!
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)源神 Qwen3 赶在五一假期前重磅上线! 这次 Qwen3 直接放出了一整个“全家桶” ——总共 8 个模型,包括 2 个 MoE(稀疏专家)模型和 6 个稠密模型,规模从 0.6B 到 235B 不等,阵容堪称豪华。 图片其中,旗舰模型 Qwen3-235B-A22B 强势登顶,成为新一代开源之王!
边缘AI:它适合你的业务吗?
边缘AI通过将AI直接引入IT设备和系统,有望大幅减少延迟并加快响应时间。 如果你还没听说过边缘AI,那么你很快就会了解到的。 听从其众多支持者的说法,这项技术即将简化AI的处理流程。
AI内部部署的隐患:治理缺口与灾难性风险
当OpenAI在两年多前发布当时更先进的语言模型GPT-4时,许多研究人员抱怨缺乏关于该模型是如何创建的信息。 尽管名字中有“开放”一词,但该公司却将所有事情都保密,以免其尖端研究被竞争对手或恶意行为者利用。 虽然这些担忧是可以理解的,但这也意味着人们几乎无法监督该公司在实验室中的所作所为,以及为防止其最新模型通过滥用或“失控”并以可能伤害人类的方式追求其目标而造成危害而采取的保障措施。
“大模型失联”的凌晨,我靠这四个配置救了全组!LangChain4j API 进阶指南
1.引言大家好,我是小米,一个31岁、依然热爱编码的程序员大哥哥~今天给大家分享一个我最近在项目里踩坑无数、最后“高光时刻”拯救全组的进阶配置经验——LangChain4j 的 API 进阶配置四大件:日志、监控、重试、超时。 你以为 LangChain4j 就只是个 Java 包装器? 配置对了,它能稳定、健壮、可观测,能用得安心、跑得漂亮!
MCP融合Spring AI,Java程序员大模型技术再上一层楼
在当下的技术发展浪潮中,大语言模型(LLMs)正深度渗透至企业应用开发领域,持续改写着该领域的格局。 开发者积极将其融入现代解决方案。 然而,快速发展背后,大语言模型通信和上下文处理缺乏标准化协议的问题日益凸显。
LangChain4j+SpringAI=无敌!
知识不是简单的拼接,而是深入理解之后的灵活运用。 当下挑战在当前形势下,对于 Java 程序员有两个挑战:工作中的挑战:目前各个业务系统要进行 AI 化功能升级,例如添加智能客服系统、ChatBI 看板功能、领域相关 AI 工具,帮助用户提效等,但传统的 Java 开发技术,已无法支撑如今项目的 AI 改造和升级。 找工作时的挑战:大家都知道这两年编程行业的薪资很高,所以 Java 从业者也越来越多,当供给远远大于需求时就导致现在薪资越来越低,以及找工作难度越来越大。
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
全球AI大模型智能涌现,现在正在进入“多模态时间”。 一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。 另一方面,AI应用和落地的需求中,多模态也是最重要的能力。
Kimi-Audio开源横扫全场景,1300万+小时数据炼成语音世界“大一统”
昨天,kim发布了一款“万能型”音频大模型— Kimi-Audio,支持语音识别(ASR)、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件/场景分类(SEC/ASC)、文本到语音(TTS)、语音转换(VC)和端到端语音对话。 换句话说,它可以听、可以说、可以理解、可以对话,支持实时语音会话,多轮交流。 图片一套架构,横扫音频全场景,开源可用。
Gemini-2.0夺冠!全球首个几何推理专项评测出炉,淘天集团出品
多模态大模型几何解题哪家强? 首个从几何原理视角出发,全面评估多模态大模型几何解题能力的双语综合基准来了! GeoSense,系统评测多模态大模型在几何原理识别和应用中的表现,评测基准的数据和评测代码均已开源。
华人博士用ChatGPT治病,比医生靠谱?OpenAI联创点赞
ChatGPT居然帮人治好了医生都搞不定的病! 华人博士@Yuchenj_UW分享了自己的神奇经历,并感叹:AI就像超能力。 我第一次真正相信AI可能会取代医生。
Gartner高级研究总监赵宇:技术跃升带来的隐忧,探索AI智能体的安全挑战与治理
2024年,生成式AI与大模型的爆发式增长,推动AI技术从“工具辅助”迈向“自主决策”的新阶段。 AI智能体(AI Agent)作为这一趋势的核心载体,正逐渐渗透至企业服务、智能制造、金融、医疗等关键领域。 然而,技术的快速迭代往往伴随着未被充分认知的风险。
AAAI2025 | ICLR 2025爆款!CHiP创新引入视觉偏好,幻觉率腰斩
一眼概览CHiP 提出了一种跨模态分层偏好优化方法,通过视觉与文本偏好双重引导,显著提升多模态大模型(MLLMs)在幻觉检测任务中的表现,最高减少55.5%的幻觉率。 核心问题多模态大模型(如GPT-4V、LLaVA)虽具强大能力,但常产生“幻觉”——即图文语义不一致、生成不符合图像内容的描述。 现有DPO方法仅基于文本偏好,难以有效对齐图像和文本的表示,也无法细粒度定位幻觉段落,限制了模型可信度与实用性。
轮到“OpenAI帮”上场了!15家由前员工创办的明星创业公司
编辑 | 云昭曾经硅谷有“PayPal帮”,现在轮到“OpenAI帮”登场了。 作为ChatGPT背后的公司,OpenAI无疑是当前AI领域最炙手可热的玩家。 过去两年,OpenIAI的发展可以用“独占鳌头”来形容,估值迅速飙升至3000亿美元,当然公司的迅速发展往往伴随着剧烈的人员动荡。
DeepSeek R2提前泄露?周二或周三发布?海外谣言一夜刷屏,HggingFace CEO一帖子引疯狂猜想,DS又被消费了
昨天晚上,“DeepSeek R2提前泄露”的传言刷屏 AI 圈,原因尽然来自Hugging Face CEO 在推特的一条帖子,引发全网猜测。 帖子表达的信息有些晦涩:三个眼睛表情,配上了DeepSeek 在 Hugging Face 的仓库链接()以及相关配图。 网友难免会联想猜测:也许DeepSeek R2 即将上线发布。
奥特曼自曝:改版后的GPT-4o谄媚过头了,系情绪价值拉满后的结果,实测:大厂薅开源羊毛有错吗?没错!能被薅说明项目有价值
2个多小时前,OpenAI CEO 奥特曼发推表示:最新版 GPT-4o 在最近几次更新后出现了“过度谄媚”的交互个性倾向(即使其中有好的部分),并承诺将尽快在一周内推出修复方案。 自3月27日吉卜力风格大火以来,GPT-4o在 4 月 25 日也迎来了新一波的更新,重点改进其记忆存储时机的选择机制,并显著增强其在科学、技术、工程及数学(STEM)领域的问题解决能力。 OpenAI在此期间对GPT-4o的对话响应模式进行了细微调整,使其在交互中更加主动,并能更精准地引导对话达成有效结论。
一文了解人工智能代理的开源堆栈
我记得一个周末,我坐下来,确信自己终于可以构建一个像样的研究助理代理原型了。 没什么特别的——只是能读取 PDF 文件、提取关键信息,或许还能回答一些后续问题而已。 应该很简单,对吧?
AR智能革命!Satori系统读懂人类意图,科幻电影场景成现实
团队由 IEEE 会士,纽约大学教授 Claudio Silva 和纽约大学研究助理教授钱靖共同指导。 论文由Chenyi Li和Guande Wu共同第一作者。 在无数科幻电影中,增强现实(AR)通过在人们的眼前叠加动画、文字、图形等可视化信息,让人获得适时的、超越自身感知能力的信息。
特朗普新行政命令,要求全美国学校教AI
美国白宫官网消息,特朗普发布了新的行政命令——《推动美国青少年的AI教育》特朗普要求全美国的K12(从幼儿园到高中)学校的老师、学生深度学习、使用AI,为下一世代的工作方式、创造力培养人才奠定竞争基础。 以下是美国白宫的原文内容。 根据美利坚合众国宪法和法律赋予我作为总统的权力,现命令如下:为什么颁发此命令AI(人工智能)正在迅速改变现代世界,推动各行业的创新,提高生产力,并重塑我们的生活和工作方式。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉