AI在线 AI在线

AI

构建强大AI Agent的关键 = Pydantic AI + MCP + Advanced Web Scraping

引言在文中,我将展示一个超快速教程,教你如何使用 Pydantic AI、MCP 和高级网页抓取技术,构建一个强大的智能聊天机器人,适用于商业或个人用途。 MCP 逐渐被接受,因为它是一个开放标准。 我制作了一些非常酷的视频,你一定会喜欢。
6/3/2025 1:04:00 AM
AI研究生

AI辅助编程工具深度评测与企业选型指南

今天继续分享Google DeepResearch的AI编程工具研发分析报告。 具体的提示语如下:请对Cursor,Winsurf, Copilot,Augument 四款AI辅助编程工具进行详细分析和研究和评测。 需要从功能(核心是编程能力,上下文长度支持等),效率性能,质量,成本,易用性,开放性(mcp协议适配),差异化亮点多方面进行分析和研究。
6/3/2025 1:00:00 AM

阿里发布 QwenLong-L1 超长文本杀器!已开源、支持 120k 长上下文、具备“翻书回溯”能力

业界普遍认为AI上下文越长越好,但这存在一个核心矛盾:模型能“吞下”海量信息,却难以真正“消化”。 面对长文,它们会忘记要点、无法深入推理,这已成为一大瓶颈。 例如,AI 能记住第1页的内容,同时理解第100页的观点,并将两者联系起来进行推理吗?
6/3/2025 12:00:09 AM

投资回报率几何?AI的失败促使CEO们重新思考其应用

根据IBM商业价值研究院对CEO们的调查,近年来仅有25%的AI计划达到了ROI预期,同时,仅有16%的AI项目在企业范围内得到了全面推广。 部分问题在于,企业并不清楚自己将要面对什么,近三分之二的CEO承认,在尚未明确了解其价值之前,对错失新技术的恐惧就驱动了投资,这往往导致为了ROI而匆忙推进AI项目,或仅为了展示而启动项目,这两种做法都难以成功。 见证了过去两年半AI淘金热的IT专家们,对AI项目表现平平并不感到惊讶。
6/3/2025 12:00:00 AM
Grant Gross

Anthropic 开源神经网络追踪工具,可生成归因图直观展示 AI 模型处理提示词具体过程

Anthropic开源新一代神经网络追踪工具,可生成归因图展示AI模型推理过程,并与Neuronpedia平台结合提供互动体验。CEO Dario Amodei强调此举将提升大模型可解释性。#AI可解释性# #开源工具#
6/2/2025 5:13:32 PM
漾仔

谷歌悄然推出“AI Edge Gallery”应用:可在手机本地运行 AI 模型

谷歌发布Google AI Edge Gallery应用,支持手机离线运行Hugging Face的AI模型,可生成图像、回答问题等。无需联网,直接利用手机处理器计算。目前为实验性Alpha版本,安卓可用,iOS即将推出。#AI应用# #谷歌黑科技#
6/1/2025 7:06:39 AM
远洋

消息称 Meta 计划让 AI 接管 90% 产品风险评估,取代人工审核

Meta计划将高达90%的风险评估工作交由AI完成,包括青少年风险和暴力内容等敏感领域。尽管AI审核能加快流程,但员工警告可能忽视人工能识别的严重风险。最新报告显示,政策调整后删除内容减少,但霸凌和暴力内容略有上升。#MetaAI审核# #社交媒体安全#
6/1/2025 6:43:01 AM
远洋

谷歌野心藏不住!劈柴哥放话:AI比互联网更颠覆!智能体将打造新的中间平台生态;记者:Chrome被卖了咋办?

出品 | 51CTO技术栈(微信号:blog51cto)I/O大会,谷歌用Gmini 2.5 Pro、Veo 3证明了自己在AI领域的绝对实力。 刚刚,知名科技媒体Verge放出了谷歌CEO劈柴哥的采访,看完发现——谷歌的AI逆袭绝非偶然! 在24年,谷歌还在被OpenAI追着打的时候,劈柴哥就曾表示大厂的AI竞争并非一朝一夕之功,如果眼光放长远些,短期内谁领先、谁落后,其实并不重要。
5/31/2025 9:32:35 PM
伊风

谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒

谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。
5/31/2025 11:24:22 AM
故渊

谷歌联合创始人 Sergey Brin 揭秘:AI 爱吃“罚酒”,受威胁后反而提升性能

在出席迈阿密举办的 All-In-Live 活动中,谷歌联合创始人谢尔盖・布林(Sergey Brin)抛出新观点,有时候恐吓人工智能(AI)模型,反而能刺激提升其表现。
5/31/2025 10:43:01 AM
故渊

美国白宫委员会编制儿童健康报告被指 AI 造假:引用“幽灵论文”,结论遭质疑

纽约时报于 5 月 29 日发布博文,报道称由美国白宫 Make America Healthy Again Commission 委员会编写的儿童健康报告,大量引用了不存在的科学研究,因此报告给出的数据和结论遭到质疑。
5/31/2025 10:27:05 AM
故渊

BFL 推出 FLUX.1 Kontex 模型套件,AI 生图速度比主流竞争对手快一个数量级

科技媒体 WinBuzzer 昨日(5 月 30 日)发布博文,报道称 Black Forest Labs(BFL)推出全新 AI 模型套件 FLUX.1 Kontext,专注于生成与编辑上下文图像,号称速度比主流竞争对手快一个数量级。
5/31/2025 9:55:51 AM
故渊

新型人工智能检测可预测前列腺癌患者是否能从药物中获益

近日,国际医学界传来令人振奋的消息,一种新开发的人工智能(AI)工具可以预测哪些前列腺癌患者能够从一种能够将死亡风险降低一半的药物 —— 阿比特龙(abiraterone)中获益。 这种药物被称为前列腺癌治疗的 “游戏规则改变者”,在100多个国家中成为男性最常见的癌症治疗选择,已帮助数十万名晚期前列腺癌患者延长了生命。 然而,一些国家,尤其是英国,对于尚未扩散的前列腺癌患者并未广泛提供这款 “惊人的” 药物。
5/30/2025 4:00:54 PM
AI在线

美团开放AI代码工具,零代码实现全栈能力,项目负责人揭秘架构细节

一句话,呈所想。 谁都没有想到,如此实用的 AI 代码生成工具,竟是出自美团。 上周,有媒体曝出了美团的 AI 零代码工具 NoCode,这是一款无需编程背景和经验,仅通过自然语言和对话形式即可快速生成应用的工具。
5/30/2025 3:59:41 PM

多模态扩散模型开始爆发,这次是高速可控还能学习推理的LaViDa

近段时间,已经出现了不少基于扩散模型的语言模型,而现在,基于扩散模型的视觉-语言模型(VLM)也来了,即能够联合处理视觉和文本信息的模型。 今天我们介绍的这个名叫 LaViDa,继承了扩散语言模型高速且可控的优点,并在实验中取得了相当不错的表现。 现目前,几乎所有流行的 VLM 都是基于大型语言模型(LLM)构建的,而这些模型采用的范式是自回归(AR),即按照从左到右的顺序逐一生成 token。
5/30/2025 3:54:16 PM

大模型智能体如何突破规模化应用瓶颈,核心在于Agentic ROI

本文第一作者为上海交通大学计算机学院副教授刘卫文,研究方向为大模型智能体,大语言模型,个性化算法等。 近年来,随着大语言模型的快速发展,基于其构建的大模型智能体(LLM Agents)正逐步从技术演示走向实际应用部署。 然而,真正实现规模化应用仍面临诸多瓶颈。
5/30/2025 3:53:27 PM

OpenAI 坚决反击马斯克:法院裁定请求毫无依据

据路透社报道,OpenAI 近日向法院提出申请,要求继续对特斯拉创始人埃隆・马斯克进行反诉。 OpenAI 在法庭文件中表示,马斯克请求驳回其反诉的动议 “毫无事实依据”。 这一案件的持续发酵,再次引发了公众的关注。
5/30/2025 3:00:54 PM
AI在线

Google 的 Agent2Agent(A2A)框架详解

作者 | Nirdiamant编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP,市面上已经有不少干货解读了,但作为经常被拿来对比的 A2A,内容却很少,今天为大家详细解读下 A2A 的架构。 想象你走进一个繁忙的办公室,才华横溢的专家们正在处理各类复杂项目。 一个角落里,研究分析师在挖掘数据;旁边,设计专家在绘制视觉方案;另一边,物流协调员在安排货运。
5/30/2025 2:59:36 PM
云昭