AI
逆天强大!Spring AI 身份证识别,图片分析真牛啊
环境:SpringBoot3.4.21. 简介人类处理知识时,会同时通过多种数据输入模式进行。 我们的学习方式、经验积累本质上都是多模态的。
AWS报告:2025年全球技术预算中GenAI将超越安全
“我认为这并不值得担忧,”AWS GenAI和AI/ML市场推广副总裁拉胡尔·帕塔克(Rahul . Pathak)在接受采访时表示,“我的理解是,客户的安全仍然是重中之重。 我们看到AI在预算优先级方面如此重要,是因为客户看到了AI的众多应用场景。
从RAG到QA-RAG:整合生成式AI以用于药品监管合规流程
图片引言聊天机器人的进步近期生成式AI的进展显著增强了聊天机器人的能力。 这些由生成式人工智能驱动的聊天机器人在各个行业中的应用正在被探索[Bahrini等人,2023年;Castelvecchi,2023年;Badini等人,2023年],其中制药行业是一个显著的关注领域。 在药物发现领域,最近的研究表明,由生成式人工智能驱动的聊天机器人在推进药物发现方面可以发挥重要作用[Wang等人,2023年;Savage,2023年;Bran等人,2023年]。
无需代码与营业执照:用Cursor AI快速搭建个人支付网站
一、背景与技术选型1.1 个人支付场景的需求爆发随着知识付费和自由职业的兴起,独立开发者、内容创作者对个人收款工具的需求激增。 传统解决方案存在两大痛点:需要企业资质和开发成本过高。 本文提出的技术方案完美解决了这两个问题。
RAG技术:优化知识库,解决AI答非所问
在AI大模型席卷全球的今天,Retrieval-Augmented Generation(RAG,检索增强生成)作为一种融合检索与生成的技术,正成为企业和开发者提升AI能力的核心工具。 然而,许多用户在使用RAG时却发现,AI的回答常常“答非所问”,甚至“驴唇不对马嘴”。 究其原因,问题往往出在文档处理不当。
巨头砸钱、码农通宵!为何技术大佬集体高潮的MCP 普通人却无感?
最近几个月,AI 圈突然被MCP刷屏了。 这个由 Anthropic 在2024年底推出的模型上下文协议(Model Context Protocol),被称为 "AI 世界的 USB-C 接口"。 简单来说,它就像一个万能插座,让大模型能轻松连接外部工具、数据库甚至物理设备,实现从 "动口" 到 "动手" 的跨越。
黄仁勋揭秘自己如何用 AI 学习:先让“老师”把自己当成 12 岁小孩
黄仁勋表示:“我每天都在用它们学习。对那些我不熟悉的领域,我会先让 AI 用‘给12岁小孩讲解’的方式开始解释,之后再逐步深入到博士水平。
OpenAI计划大幅降低与微软的收入分成比例
据最新报道,OpenAI 已向其投资者透露,计划在未来几年的时间里显著减少与微软的收入分享比例。 该消息引起了业界的广泛关注,因为这可能会对 OpenAI 与微软之间的合作关系以及双方的商业模式产生深远影响。 根据报道,到2030年,OpenAI 与微软之间的收入分成比例将至少下降50%。
Parloa融资1.2亿美元,市值突破10亿美元,欲扩展企业AI客服平台
近日,客户体验领域的创新公司 Parloa GmbH 宣布成功融资1.2亿美元,使其估值达到10亿美元。 这笔新资金将用于加速公司在北美和欧洲的扩张,增强其人工智能代理管理平台,并招聘国际人才。 自2018年成立以来,Parloa 专注于为企业提供 AI 驱动的客户服务解决方案。
美国IT行业就业状况变化:AI 职位激增184%,传统岗位逐渐减少
根据 Janco Associates 的最新数据,美国 IT 行业的失业率在四月份降至4.6%。 虽然这一数字表明整体就业情况有所改善,但对许多中级专业人士而言,尤其是那些缺乏人工智能(AI)技能的求职者,面临的挑战却在加剧。 随着 AI 和自动化技术的快速发展,求职市场的需求正在发生显著变化。
消息称通义视觉负责人薄列峰离职 或加入某大厂新组建多模态团队
据多方信源透露,阿里巴巴通义实验室应用视觉团队负责人薄列峰(职级P10)已于2024年4月30日正式离职,并低调加盟某头部互联网公司,出任新设立的多模态模型部副总经理一职。 尽管该互联网公司具体名称尚未公开,坊间普遍猜测其去向可能是字节跳动或腾讯,但目前相关公司及本人均未作出回应,尚无法证实具体归属。 图源备注:图片由AI生成,图片授权服务商Midjourney此次人事变动引发业界关注的另一焦点在于“竞业限制”。
IBM 首席执行官:AI 已取代数百名人力资源员工
华尔街日报今天(5 月 7 日)发布博文,报道称 IBM 首席执行官 Arvind Krishna 表示,公司已使用 AI 来取代数百名人力资源员工的工作,不过因此招聘了更多的程序员和销售人员。
老牌 IDE巨头跌落神坛?JetBrains被曝深夜删评惹众怒,用户怒斥"还钱!卸载不掉!"
编辑 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto)JetBrains AI Assistant 又翻车了,这次是删评论。 作为 JetBrains 家族的“AI门面担当”,JetBrains AI Assistant 自 2023 年 7 月发布以来,一直饱受开发者吐槽:功能鸡肋、集成过深、无法卸载。 但真正把这款产品送上风口浪尖的,是 JetBrains 本周在自家论坛里的一波“夜间行动”——悄悄删差评。
微软推出三大 AI 新功能,提升 Windows 11 使用体验
在5月6日的最新发布会上,微软宣布了一系列新的 AI 功能,旨在提升 Windows11用户的使用体验。 这些功能将在 Copilot PC 上首发,并逐步推向所有 Windows11用户。 微软引入了一款 AI 代理,帮助用户更便捷地修改 Windows 设置。
新兴混合 AI 模型 CausVid:几秒钟内生成高质量视频
近日,麻省理工学院计算机科学人工智能实验室(CSAIL)与 Adobe Research 联合研发的创新性 AI 模型 CausVid 引起了广泛关注。 这一混合模型可以在几秒钟内生成高质量视频,标志着视频创作领域的一次重大技术突破。 创新的技术架构CausVid 的设计理念颠覆了传统的视频生成方式。
Google 高管证实:数据 “偏袒” 自家 AI,拒绝竞品获取搜索数据
在一场备受关注的法庭听证会上,Google 搜索业务负责人利兹・里德(Liz Reed)向外界揭示了公司对待人工智能(AI)模型数据请求的态度。 她明确表示,尽管 Google 去年已开始向部分 AI 公司开放利用其搜索结果的渠道,但关键的搜索数据仍然优先供给自家的 AI 服务 Gemini,这一证词为反垄断监管机构的调查提供了重要支持。 近年来,美国司法部对 Google 的反垄断调查持续升温,要求该公司共享用于构建搜索结果的大量数据。
NBC 将利用 Jim Fagan 的 AI 生成声音为 NBA 赛事增色
NBC 近日宣布,将在即将到来的 NBA 赛事中使用已故体育解说员 Jim Fagan 的 AI 生成声音。 Fagan 于2017年去世,他的声音曾在1990至2002年期间为 NBC 的 NBA 报道增添了不少风采。 NBC 计划在10月份重新播出 NBA 比赛时,将 Fagan 的 AI 声音运用于选定的片头序列、节目开场及宣传片中。
ICML 2025 Spotlight|华为诺亚提出端侧大模型新架构MoLE,内存搬运代价降低1000倍
Mixture-of-Experts(MoE)在推理时仅激活每个 token 所需的一小部分专家,凭借其稀疏激活的特点,已成为当前 LLM 中的主流架构。 然而,MoE 虽然显著降低了推理时的计算量,但整体参数规模依然大于同等性能的 Dense 模型,因此在显存资源极为受限的端侧部署场景中,仍然面临较大挑战。 现有的主流解决方案是专家卸载(Expert Offloading),即将专家模块存储在下层存储设备(如 CPU 内存甚至磁盘)中,在推理时按需加载激活的专家到显存进行计算。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
AI新词
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
苹果
算法
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
RAG
大语言模型
字节跳动
Sora
百度
研究
GPU
生成
工具
华为
AGI
计算
AI设计
生成式AI
大型语言模型
搜索
视频生成
亚马逊
AI模型
特斯拉
DeepMind
场景
深度学习
Copilot
Transformer
架构
MCP
编程
视觉