技术
最新总结,不同抽取任务哪个模型最能打
图片在人工智能的浪潮中,多模态大模型(VLM)正以前所未有的速度改变着我们的世界。 从自然语言处理(NLP)到计算机视觉(CV),从大型语言模型(LLM)到检索增强生成(RAG)和智能体(Agent),AI的边界不断被拓展。 而今天,我们将聚焦于一个关键领域——文档结构化抽取,看看12种顶尖的VLM多模态大模型,谁才是真正的强者!
5/16/2025 1:10:00 AM
哎呀AIYA
SpringAI更新:废弃tools方法、正式支持DeepSeek!
AI 技术发展很快,同样 AI 配套的相关技术发展也很快。 这不今天刚打开 Spring AI 的官网就发现它又又又又更新了,而这次更新距离上次更新 M7 版本才不过半个月的时间,那这次 Spring AI 给我们带来了哪些惊喜呢? 一起来看。
5/15/2025 3:00:00 AM
磊哥
AI搜索初创公司Perplexity 即将完成5亿美元融资,估值达140亿美元
人工智能搜索初创公司 Perplexity 正在接近其六个月内的第二次融资,估值达到140亿美元。 这一轮融资将由风险投资公司 Accel 领投,预计金额将达到5亿美元。 Perplexity 以其先进的人工智能搜索技术受到市场的广泛关注,正逐渐成为行业内的一匹黑马。
5/13/2025 11:00:52 AM
AI在线
连续思维机器来了!Transformer八子之一创企推出,让AI不再「一步到位」拍脑袋做决定
科学界的一个共识是:即使是最复杂的现代人工智能,也难以媲美人类大脑的表现和效率。 研究者经常从大自然中寻找灵感,了解如何在人工智能领域取得进步,例如利用进化来合并模型、为语言模型进化出更高效的记忆或探索人工生命的空间。 虽然人工神经网络近年来让人工智能取得了非凡的成就,但它们仍然是其生物对应物的简化表征。
5/13/2025 8:56:54 AM
一文了解!MCP 技术生态全面解析:核心组件、工作流程、生命周期
在 AI 领域,模型上下文协议(MCP)的出现,就像是一场及时雨,完美地解决了 AI 模型与外部工具和资源交互的难题,让它们之间的协作变得轻松又自然,彻底打破了数据孤岛的困境,让不同系统之间的互操作性不再是梦想。 一、MCP 核心组件:架构精解MCP 架构 :MCP 主要有三个核心组件,分别是 MCP 主机、MCP 客户端和 MCP 服务器,它们三个相互配合,让 AI 应用和外部工具、数据源之间能够无缝通信。 MCP 主机 :就好比是一个大舞台,为执行 AI 任务提供了演出环境,并且在这个舞台上运行着 MCP 客户端,没有它,整个表演就没办法开始。
5/13/2025 1:45:00 AM
小智
突破性技术MCA-Ctrl:中科院团队引领AI图像定制化新范式
中国科学院计算技术研究所研究团队近日推出的MCA-Ctrl技术在生成式AI领域引发广泛关注,这一文本到图像(T2I)新方法正为图像定制化市场带来革命性变革。 在个性化需求日益增长的当下,该技术通过独特的多方协同注意力控制机制,让用户无需繁琐的模型微调,即可根据文本或图像条件生成高度个性化的图像内容。 MCA-Ctrl最大的技术亮点在于其三大核心应用能力:主题替换、主题生成和主题添加。
5/12/2025 5:00:52 PM
AI在线
FDA 宣布使用 AI 技术加速药品审批流程
美国食品药品监督管理局(FDA)近日宣布,将立即在其所有中心引入人工智能(AI)技术,以缩短药品审批的时间。 此次决定是在 FDA 完成了一项针对科学审查员的生成性 AI 试点后做出的。 FDA 表示,借助这项 AI 工具,科学家们可以减少大量重复性、单调的工作,从而提升审核效率。
5/12/2025 10:01:16 AM
AI在线
OpenAI与微软正商讨修改双方合作条款
根据英国《金融时报》的报道,OpenAI 和微软正在商讨修改双方的合作条款,这一调整可能为 ChatGPT 的开发公司打开未来上市的大门,并确保微软能持续获取前沿的人工智能技术。 此次谈判不仅关乎 OpenAI 的商业模式,也涉及到微软在这项技术领域的重要投资。 据知情人士透露,微软正在考虑放弃其在 OpenAI 新营利性业务中的部分股权,以换取在2030年一项重要合同到期后,能够使用 OpenAI 新开发的人工智能模型。
5/12/2025 10:01:12 AM
AI在线
因AI效率提升,网络安全公司CrowdStrike宣布裁员5%
最近,网络安全公司 CrowdStrike 在向员工发布的一封通知中,宣布将裁减全球5% 的员工,约500个岗位。 首席执行官乔治・库尔茨(George Kurtz)在文件中提到,裁员的部分原因是由于公司在业务中引入了人工智能(AI)技术,从而提高了工作效率。 库尔茨表示,当前市场和技术正在发生变革,人工智能正在重塑各行各业,带来加速的威胁和不断变化的客户需求。
5/9/2025 6:01:11 PM
AI在线
90%的AI产品发布,为什么惨败如垃圾!
作者 | 云昭每当一项新技术刚走进大众视野的5年里,这个阶段的新产品总是让人视为“鸡肋”一样的存在,即便是阅产品无数的投资人,也难免莞尔一笑,吐出一句大实话:乏善可陈。 其实,这不止是用户和投资界的反馈,AI产品创造者同样也有惨痛的经历。 “我们的AI产品发布那天,我确信我们会改变游戏规则。
5/4/2025 5:04:07 PM
云昭
Grok 3.5测试版下周上线,专为SuperGrok用户打造,专注火箭发动机与电化学技术解答
xAI宣布Grok3.5测试版将于下周正式推出,首批仅对SuperGrok订阅用户开放。 据AIbase了解,该版本以其在火箭发动机和电化学等领域的精准技术解答能力引发热议,号称“全球首个人工智能能从第一性原理推理,生成网络上不存在的答案”。 社交平台上的讨论显示,Grok3.5的专项技术能力与开放性备受期待,相关细节已通过xAI官网(x.ai)与社交媒体逐步公开。
4/29/2025 4:00:40 PM
AI在线
52页PPT,谷歌Gemini预训练负责人首次揭秘!扩展定律最优解
谷歌凭借Gemini 2.5 Pro在激烈的大模型竞争中一举翻盘。 近日,Geimini Flash预训练负责人Vlad Feinberg在普林斯顿大学分享了相关内容。 他深入分析了Gemini预训练的方法、挑战以及方向,如何在模型大小、算力、数据和推理成本间取得平衡。
4/29/2025 9:16:00 AM
新智元
100年企业知识超10万文件,「内网版ChatGPT」血洗最卷行业!全员70%和AI共事
要说什么行业是地球上「最卷」的,咨询行业说第一,恐怕没有哪个行业敢称第二。 在这个全球最精英、最高压的竞技场里,卷时间、卷精力、卷智力,现在要卷AI了! ChatGPT已经无法满足世界上最「卷」的这批人了。
4/29/2025 8:40:00 AM
新智元
特朗普新行政命令,要求全美国学校教AI
美国白宫官网消息,特朗普发布了新的行政命令——《推动美国青少年的AI教育》特朗普要求全美国的K12(从幼儿园到高中)学校的老师、学生深度学习、使用AI,为下一世代的工作方式、创造力培养人才奠定竞争基础。 以下是美国白宫的原文内容。 根据美利坚合众国宪法和法律赋予我作为总统的权力,现命令如下:为什么颁发此命令AI(人工智能)正在迅速改变现代世界,推动各行业的创新,提高生产力,并重塑我们的生活和工作方式。
4/28/2025 9:20:53 AM
微软发布2025工作趋势:每位员工将是Agent老板
微软在官网发布了2025年工作趋势指数报告,主要分析了来自中国、美国、澳大利亚、巴西、加拿大等全球31个国家/地区的31,000家企业。 同时结合了Linked劳动力市场趋势,数万亿个Microsoft365生产力信号,以及原生初创企业、学者、经济学家、科学家和思想领袖的意见。 结果显示,由Agent智能体 人类的“人机协作”模式正在重塑企业架构,一种全新形态的“前沿公司”诞生。
4/28/2025 9:17:47 AM
AIGC开放社区
从底层重构强化学习训练框架,阿里高德开源新方法:抛弃替代损失函数,仅需优化原始目标
抛弃替代损失函数,仅需优化原始目标, 强化学习新范式来了:消除critic和reference模型,避免KL散度约束;解决优势函数和梯度估计两个偏差。 来自阿里-高德地图的团队提出了一种相当简单的强化学习训练新方法:组策略梯度优化GPG (Group Policy Gradient)。 GPG开创性地从底层重构强化学习训练框架,仅需优化原始目标,解决已有方法偏差,提高训练效率。
4/27/2025 9:12:00 AM
两万人大裁员!AI掉队、工厂暂停扩张,英特尔复兴之路注定艰难
英特尔再次开启大裁员! 据彭博社报道,英特尔本周将宣布裁员超20%! 一下子裁掉2万多人。
4/25/2025 11:58:06 AM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
Stable Diffusion
AI for Science
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
百度
RAG
Sora
具身智能
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
架构
DeepMind
视觉
预测
Transformer
编程
生成式AI
伟达
AI模型
特斯拉
Copilot