理论
AI语音诈骗的克星:AI语音识别干扰系统
在AI技术日益渗透日常通信的背景下,电话诈骗手段也随之升级。 如今,诈骗者不再亲自出马,而是借助文本转语音(TTS)与自动语音识别(ASR)系统,批量拨打“钓鱼电话”,骗取用户隐私信息甚至财务数据。 根据CrowdStrike的《2025年全球威胁报告》,2024年下半年,全球“语音钓鱼”(vishing)攻击激增442%,让执法与安全机构压力倍增。
6/27/2025 5:00:00 AM
无需数据标注:RLSC 如何用“自我信心”优化语言模型
大家好,我是肆〇柒。 当下,大型语言模型(LLM)如 ChatGPT、Qwen 等展现出了卓越的推理能力,能够在多种任务中提供高质量的解决方案。 然而,尽管这些模型具有强大的基础能力,但要使其行为与特定任务目标精准对齐,后训练优化仍然是不可或缺的关键步骤。
6/27/2025 4:00:00 AM
肆零柒
简述MCP的原理-AI时代的USB接口
1 简介2 执行流程3 mcp架构3.1 mcp架构设计3.2 mcp基本功能4 mcp通信原理4.1 JSON-RPC4.2 通信方式5 生命周期5.1 环境搭建5.2 建立连接获取可用工具列表5.3 调用工具6 总结1.简介随着AI的不断发展,RAG(检索增强生成)和function calling等技术的出现,使得大语言模型的对话生成能力得到了增强。 然而,function calling的实现逻辑比较复杂,一个简单的工具调用和实现方式需要针对不同的系统和大模型单独编写适配接口,十分复杂。 在此背景下,mcp应运而生,为当前业内AI高效可靠地调用外部工具实现了标准化。
6/27/2025 3:00:22 AM
张皓昱
生成式人工智能演变:生成式人工智能简史
从 Transformers(2017 年)到 DeepSeek-R1(2025 年)2025年初,我国推出突破性且经济高效的大型语言模型(LLM)DeepSeek-R1,引发了人工智能的巨变。 本文追溯了LLM的演变历程,始于2017年革命性的Transformer架构,该架构通过自注意力机制重塑了自然语言处理(NLP)。 到2018年,首批基于Transformer的两款LLM,GPT和BERT相继发布,显著增强了语境理解和文本生成能力,为未来的创新奠定了坚实的基础。
6/27/2025 3:00:00 AM
谷歌重磅开源Gemini CLI:免费AI工具,居然要干掉GitHub Copilot?
先说说我的第一印象6月25日那天,谷歌悄无声息地放出了Gemini CLI,Apache 2.0许可证,完全免费。 我当时就想,谷歌这是要和OpenAI正面刚了? 当Cursor靠着Claude 3.5在开发者群体里风生水起,GitHub Copilot还在那里慢悠悠地更新模型支持时,谷歌这招确实有点狠。
6/27/2025 2:29:00 AM
阿丸笔记
告别复杂SQL!用Spring AI + DeepSeek构建自然语言查询系统
项目概览现代应用越来越多地采用自然语言交互界面,让用户更轻松地操作系统。 这在数据查询场景中尤为实用,非技术人员可以直接用日常语言提,文本转 SQL 聊天机器人正是这样的典型应用。 它在人类语言和数据库之间搭建了沟通桥梁。
6/27/2025 2:00:00 AM
PIG AI
七款MCP工具,彻底改变我用 AI 写代码的方式
最近笔者在用Next.js写一个前端项目项目,半夜 11 点还在手动复制SQL表结构、Google各种JS报错信息。 PS:笔者是一个算法 后端工程师,对于前端的框架语法基本上只能靠搜索完成😭。 AI 编程助手不停地吐出过时的 React Hooks 或者是没理解我意思给出我不想要的代码,这让笔者极近崩溃,甚至想把电脑给砸了!
6/27/2025 1:22:00 AM
AI研究生
Dify发布V1.5.0:可视化故障排查!超实用
Dify 本周又发布了一个实用的大版本,直接从 V1.4.3 版本干到 V1.5.0 了,那问题来了,这次更新了哪些内容呢? 接下来我们一起来看。 官方给这次更新的定义是:一个简洁、强大的更新,通过简化的调试和强大的集成功能,提升您的工作效率。
6/27/2025 12:00:00 AM
磊哥
in AI敢赌100万美元 - AI客服是真的狂还是有底气
AI浪潮汹涌澎湃,风浪越大鱼越贵! Fin AI,一家做客服机器人的公司,居然推出了"百万美元保证"计划。 什么概念?
6/27/2025 12:00:00 AM
阿丸笔记
美法院裁定AI训练使用书籍属 "合理使用",Meta与Anthropic长松一口气
美国联邦法院近日做出两项具有里程碑意义的裁决——Meta 与 Anthropic 两家 AI 巨头在版权诉讼中双双胜诉,法官明确认定其使用书籍训练 AI 模型的行为属于 "合理使用"。 这一判决为深陷版权争议的 AI 行业卸下重负,也为技术创新与知识产权保护的平衡确立了新判例。 在Meta 案中,12 名原告作者指控其 AI 模型未经授权使用数百万本书籍训练,侵犯版权。
6/26/2025 5:04:30 PM
北大腾讯突破奖励模型瓶颈!让AI理解人类偏好,泛化能力比肩GPT-4.1
总是“死记硬背”“知其然不知其所以然”? 奖励模型训练也形成了学生选择标准答案的学习模式,陷入诸如“长回答=好回答”“好格式=好答案”等错误规律之中。 北京大学知识计算实验室联合腾讯微信模式识别中心、William&Mary、西湖大学等机构提出的RewardAnything突破了这一瓶颈——通过让奖励模型直接理解自然语言描述的评判原则,实现了从”死记硬背”到”融会贯通”的范式跃迁。
6/26/2025 3:16:42 PM
量子位
96% 勒索率!Anthropic 对 AI 进行压力测试,顶尖模型集体“先保命再讲道德”
最近,Anthropic 的研究员对来自 OpenAI、Google、Meta、xAI 和 DeepSeek 等公司共 16 个前沿模型进行了压力测试。 图片研究模拟了真实企业环境,模型拥有自主行动权限,能访问公司邮件,并在设定的任务与威胁下自由做出决策。 测试结果显示:这些 AI 模型在面对“目标冲突”或“被关闭的威胁”时,普遍表现出主动伤害其雇主的倾向。
6/26/2025 3:14:55 PM
全模态RAG突破文本局限,港大构建跨模态一体化系统
突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。 香港大学黄超教授团队开源多模态智能处理系统RAG-Anything,将碎片化的信息孤岛转化为结构化的知识网络,为智能多模态文档分析开辟了全新技术路径。 RAG-Anything 是专门针对复杂多模态文档设计的新一代RAG系统,致力于破解现代信息处理中的多模态理解难题。
6/26/2025 3:11:41 PM
何恺明兼职加入 DeepMind!要在基础研究组搞大事?
刚刚,MIT教授、CV大神,成为 Google DeepMind 的杰出科学家。 不过,这次是以 part-time(兼职) 身份加入。 据网友爆料,他即将参与基础研究组的工作。
6/26/2025 3:10:22 PM
AI“读书”合法了:美法院最新裁定,无需作者同意,已购书籍可用于训练AI
无需原作者同意,AI可以用已出版书籍作训练数据了。 就在最新判决的诉讼中,美国法院裁决:允许Claude背后公司Anthropic在未经作者许可的情况下,使用合法购买的已出版书籍训练AI。 法院参考了美国版权法中的“合理使用”(Fair Use)原则,认为AI训练属于“转化性使用”(Transformative Use),即对原作品的新用途未取代原作市场,且有利于技术创新和公共利益。
6/26/2025 3:09:07 PM
刚刚,OpenAI苏黎世办公室被Meta一锅端,三名ViT作者被挖走
刚刚,华尔街日报发布了一份独家报道,称去年底刚刚组建的 OpenAI 苏黎世办公室基本被 Meta 一锅端走了。 具体来说,Meta CEO 马克・扎克伯格挖走了 Lucas Beyer、Alexander Kolesnikov 和 Xiaohua Zhai(翟晓华)三位研究者。 这三人一直以来都是密切的合作伙伴,共同参与了 ViT 等重要研究。
6/26/2025 3:07:54 PM
具身世界模型新突破,地平线 & 极佳提出几何一致视频世界模型增强机器人策略学习
近年来,随着人工智能从感知智能向决策智能演进,世界模型 (World Models)逐渐成为机器人领域的重要研究方向。 世界模型旨在让智能体对环境进行建模并预测未来状态,从而实现更高效的规划与决策。 与此同时,具身数据也迎来了爆发式关注。
6/26/2025 3:06:47 PM
AI秒懂短视频,快手大模型Keye-VL理解力爆表!技术细节全开源
如果有人突然问你:「这张图片中有几颗草莓」? 你会如何快速回复? 面对五彩缤纷的果盘,我们往往需要反复端详,放大图片再逐一清点,耗费不少时间才能得到答案。
6/26/2025 3:05:45 PM
资讯热榜
李沐B站更新了!教你手搓语音大模型,代码全开源还能在线试玩
考试提分新工具:网页版 ChatGPT 测试“学习和掌握”功能,AI 助你成学霸
AI时代设计师如何突围?D20峰会揭示未来设计师生存法则
一盘大棋!OpenAI「截胡」IMO金牌,奥特曼为GPT-5献上「核弹级」预热
终结Coding?ShellAgent三句话造出马斯克同款「AI女友」!
DeepRare 重磅发布:全球首个可循证智能体诊断系统,直击医学Last Exam难题
阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美
“思维链”窗口正在关闭!OpenAI、谷歌、Anthropic联合研究:我们正在失去理解 AI 的能力
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
Anthropic
英伟达
代码
智能体
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
苹果
LLM
神经网络
AI新词
Claude
3D
研究
生成
机器学习
AI for Science
xAI
计算
人形机器人
Sora
AI视频
Agent
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
RAG
预测
大型语言模型
深度学习
伟达
Transformer
具身智能
视觉
神器推荐
亚马逊
视频生成
AGI
Copilot
DeepMind
模态
架构
LLaMA