理论
ColPali联手DocLayNet:打造能“看懂”文档布局的视觉问答神器!
译者 | 朱先忠审校 | 重楼本文介绍ColPali与DocLayNet结合的多模态RAG系统,通过视觉语言建模理解文档中的表格、图表等布局信息,显著提升复杂文档问答的准确性和上下文感知能力。 简介检索增强生成(RAG)已成为构建开放领域和特定领域问答系统的标准范例。 传统意义上,RAG流程严重依赖于基于文本的检索器,这些检索器使用密集或稀疏嵌入来索引和检索段落。
8/14/2025 8:00:51 AM
朱先忠
网络安全中的哈希算法简介与实践
网络安全中的哈希算法是一种单向过程,使用加密函数将数据转换为固定长度的字符串(称为哈希或摘要)。 确保数据的完整性和安全性,因此对于密码存储、数字签名和区块链应用至关重要。 无论你尝试多么独特的密码组合,你确定它无法被破解吗?
8/14/2025 7:59:30 AM
何威风
人工智能的局限性:人工智能无法企及的领域和任务
译者 | 李睿审校 | 重楼从图像识别、语言翻译到在国际象棋比赛中击败人类,人工智能如今取得了非凡的成就。 然而,人工智能并非万能,其在一些关键领域和任务上的能力仍远逊于人类。 目前的人工智能系统是“狭义”的专家,擅长解决定义明确的问题,但在需要常识、创造力或情感理解的情境中却难以应对。
8/14/2025 7:48:12 AM
李睿
尽管新协议不断推出,AI互操作性难题依然存在
在一年内,许多企业可能会运行数十个智能体,其中一些由企业内部构建,另一些则从五六个不同的供应商处购买。 对于一些CIO来说,这听起来就像是互操作性难题,近几个月来,虽然已经出现了一些AI标准化协议,但哪些协议将在市场上胜出仍不明朗,CIO们仍面临诸多棘手问题。 从长远来看,多智能体IT环境的倡导者认为,随着智能体接手大量目前由员工完成的琐碎且重复的任务,该环境有望大幅提高效率并显著节约成本,但与此同时,许多IT领导者也看到了严重的互操作性问题,包括数据安全、成本控制,以及多个智能体协同工作时对结果的不信任。
8/14/2025 7:10:00 AM
Grant
拥抱 AI:转转智能客服自主化升级之路
1 前言2 进化之路:从构想到落地2.1 技术路线选择——NLP 还是 AIGC? 2.2 模型构建与训练——厚积薄发2.3 稳扎稳打——线上灰度与数据验证3 总结1.前言转转2015年上线后,机器人客服系统历经多年,完成了三次重要版本迭代。 但核心NLP(自然语言处理)能力一直依赖外部厂商,资源受限,一直没有完成突破。
8/14/2025 2:55:00 AM
李帅
AIOps系列 | 开发 K8s GPT 故障诊断工具
前面我们介绍了 《开发 K8s Chat 命令行工具》,实现了通过和 Kubernetes 进行交互的方式进行运维,虽然文章中所描述的功能比较简单,但是可以以此进行扩展,丰富功能。 那本章,我们将在 《开发 K8s Chat 命令行工具》的基础之上,增加 Kubernetes 故障诊断工具,其主要功能点是:获取集群的 event 时间,特别关注 warning 级别事件然后进入对应的 pod 获取日志大模型结合事件和日志进行分析,得出解决问题的建议当然,这里也只是起到一个抛砖引玉的作用,提供简单的思路,可以自行扩展。 开发过程(1)首先使用 cobra-cli 新增一个 analyze 命令复制(2)然后在 analyze 下面添加一个子命令 event,专门用于分析事件复制(3)设计一个方法 getPodEventsAndLogs 用于获取 K8s 的事件和日志复制我们使用一个 map[string][]string 来保存 pod 的事件和日志信息,然后通过 client-go 获取 warning 级别的事件,最后过滤需要的 pod 事件以及 pod 相关信息,然后继续通过 client-go 获取对应 pod 的日志,然后把这些信息放到 map 中。
8/14/2025 1:11:00 AM
乔克
微软反制Meta发起人才狙击战!“精准打击”名单+特制数百万美元薪酬包,高管24小时内批复
螳螂捕蝉,黄雀在后。 Meta再次陷入挖人大战,但这次是被挖的一方。 内部文件显示,微软计划用数百万美元的薪酬包从小扎手里挖人。
8/13/2025 6:32:47 PM
OpenAI女CEO太狠了!智商148,GPT-5才是真印钞机
为什么GPT-5会让老用户失望,但免费用户沸腾到要限流? 为什么一个聊天模型,会突然懂得「花钱买成果」? 为什么OpenAI用GPT-5在下一盘大棋,可能让广告公司和搜索引擎都睡不着?
8/13/2025 6:31:52 PM
马斯克删除xAI「研究员」职位引爆网络!LeCun怒批:如此暴力将扼杀创新
1945年7月16日凌晨,美国新墨西哥州的荒漠深处,人类历史上第一颗原子弹试验即将启动。 就在倒计时前,年轻的数学家与工程师理查德·哈明(Richard Hamming)还在焦虑地反复检查他的计算结果。 因为曼哈顿计划的科学家们曾严肃提出一个极端假设:原子弹造成的高温是否可能引发空气中氮/氧核聚变从而点燃大气层。
8/13/2025 6:31:26 PM
马斯克手撕OpenAI,奥特曼反击:AI巨头互曝老底,苹果被拖下水
8月12日,埃隆·马斯克在社交平台X上发布了一则爆炸性指控。 他声称,苹果正在利用App Store的机制,使得除了OpenAI之外的任何AI公司都无法登上榜首。 图片马斯克将此行为称作“明确的反垄断行为”,并表示其旗下公司xAI将立即采取法律行动。
8/13/2025 6:30:56 PM
AI 新势力挑战搜索巨头!Perplexity 砸下 345 亿美元要买谷歌 Chrome
一笔收购意向,震动了全球科技圈。 据多家权威媒体披露,AI搜索创业公司 Perplexity 向谷歌开出 345 亿美元的收购要约,目标直指 Chrome 浏览器。 这家成立仅三年的旧金山公司,目前估值约 180 亿美元,而报价几乎翻倍。
8/13/2025 6:30:37 PM
突袭GPT-5!Claude甩出百万上下文王炸!开发者吵翻:超出LLM极限,贵还没价值?谷歌大佬分享:用好上下文的四个编程技巧
编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)深夜更新! Claude Sonnet 4 已经支持百万级上下文窗口了! 这次升级,将上下文从原本的 20 万 Token 一口气提升 5 倍——百万上下文究竟有多大?
8/13/2025 1:38:08 PM
伊风
多模态大脑建模技术迈入新纪元:Meta 10亿参数模型获Algonauts 2025大脑建模竞赛冠军
编辑丨coisini在过往研究中,神经科学的发展通常源于对认知任务与脑区研究的不断细化。 研究多聚焦于特定皮层区域及其关联功能,例如,专注于大脑 V5 区研究运动感知。 这种「分而治之」的研究范式虽为理解大脑认知机制提供了深刻见解,却导致了学科知识的碎片化,阻碍了统一认知模型的发展。
8/13/2025 12:56:00 PM
ScienceAI
奥特曼公然叫板马斯克!重金杀入脑机接口,硅谷两大巨头彻底决裂
马斯克和奥特曼,看来是要不死不休了! 曾经的好兄弟,如今的死对头,在AI战场上,两人早就杀红了眼。 2015年10月6日旧金山二人同台&AI让他俩打起来你以为这就完了?
8/13/2025 12:46:58 PM
新智元
OpenAI没开源的gpt-oss基础模型,他去掉强化学习逆转出来了
前些天,OpenAI 少见地 Open 了一回,发布了两个推理模型 gpt-oss-120b 和 gpt-oss-20b。 但是,这两个模型都是推理模型,OpenAI 并未发布未经强化学习的预训练版本 gpt-oss 基础模型。 然而,发布非推理的基础模型一直都是 AI 开源 / 开放权重社区的常见做法,DeepSeek、Qwen 和 Mistral 等知名开放模型皆如此。
8/13/2025 11:42:09 AM
随着智能体工具兴起,银行业加速AI部署
Evident Insights上周发布的AI报告显示,今年上半年,随着智能体工具在该领域开始崭露头角,银行加大了AI的应用力度,分析发现,全球50家最大的金融企业推出的新应用案例数量,较2024年下半年翻了一番,从事自主式AI研究的技术人员数量增长了十倍以上。 Evident表示,在所分析的银行部署的173个应用案例中,超过半数都利用了GenAI的能力,50家企业中有9家记录了处于试点或生产阶段的智能体,但纽约银行、第一资本和摩根大通是仅有的三家披露了智能体工作流支持架构细节的企业。 报告称,银行正努力实现双重目标。
8/13/2025 11:14:47 AM
Matt
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
AI新词
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
华为
大语言模型
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
编程
DeepMind
亚马逊
特斯拉
AI模型