资讯列表
ListenHub:颠覆播客体验的 AI 生成工具正式上线
近日,一款名为 ListenHub 的 AI 播客生成器正式上线,凭借其独特的技术优势和用户友好的界面,迅速吸引了众多播客爱好者的目光。 ListenHub 是一款轻量级的播客生成工具,支持中文和英语,为用户提供个性化的播客体验。 其核心技术基于前沿的人工智能,能够快速生成与用户兴趣相关的专属播客。
消息称Google I/O大会或发布Gemini驱动的全新AI搜索引擎
有消息人士透露,Google 可能会在其年度 I/O 开发者大会上发布一款颠覆性的全新搜索引擎,该引擎的核心技术将是 Google 最新的生成式人工智能模型 Gemini。 据称,目前该新搜索模式已经开始进行小范围的灰度测试。 如果消息属实,这可能标志着 Google 将其最重要的流量入口——目前的搜索框——全面切换到基于 Gemini 的 AI 搜索引擎。
苹果AI战略受挫:升级版Siri或将错过WWDC,内部分歧导致发展滞后
彭博社记者Mark Gurman今日凌晨发布报道,详细揭示了苹果在AI领域的战略失误及内部冲突,同时披露了公司今年在AI方面的部分进展计划。 根据Gurman的报道,升级版Siri将继续"难产",发布时间可能晚于下月的全球开发者大会(WWDC)。 虽然新版Siri可能会与iOS19一同在WWDC亮相,但预计不会被重点提及,且实际发布仍需几个月的等待时间。
Nest 音响现蓝紫渐变灯光,Google Gemini 助手正在测试中
近期,许多用户在 Reddit 上分享了他们的 Nest Audio 扬声器显示出蓝色和紫色渐变灯光的体验,这与平时的白色 LED 灯光形成了鲜明的对比。 这一新变化引起了广泛的关注,许多用户纷纷表示也看到了这种色彩变化。 根据9to5Google 的报道,谷歌正在逐步推出其新一代 AI 助手 ——Gemini,并计划逐步取代现有的 Google Assistant。
杭州机场推出全国首个AI大模型智能呼叫中心,服务体验再升级
杭州萧山国际机场于5月16日成功启用全国民航首个基于 AI 大模型的智能呼叫中心,标志着其96299热线进入了一个全新的智能化时代。 这一升级采用了前沿的 DeepSeek 大模型技术,旨在提升客户服务的效率和质量。 自2014年首次上线以来,96299热线为旅客提供24小时不间断的接听与在线咨询服务。
Meta 请求法官在反垄断案件中提前裁决
Meta 公司最近向法庭提交了一项动议,请求在目前进行中的反垄断案件中提前做出裁决。 该案件由美国联邦贸易委员会(FTC)提起,指控 Meta 通过收购 Instagram 和 WhatsApp 等方式,非法垄断了社交网络市场。 Meta 认为,经过五周的审理,FTC 未能提供足够的证据证明其指控成立。
研究称, AI 能独立自发组成社会,形成自己的规范和习俗
近日,伦敦大学城市学院与哥本哈根信息技术大学的研究人员进行了一项引人注目的实验,结果表明,人工智能(AI)能够在没有外界干预的情况下,自发形成类似人类的社会规范和习俗。 这项研究的成果已于5月14日发表在《Science Advances》杂志上,标志着 AI 群体行为研究的新进展。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项实验中,研究团队将多种 AI 智能体置于去中心化的交流环境中,模拟了人类社会中的群体互动。
Ollama推出全新多模态AI引擎,推理性能显著提升
前不久,Ollama 宣布推出一款全新的多模态 AI 引擎,这款引擎的研发是独立于原有的 llama.cpp 框架进行的,标志着公司在人工智能领域迈出了重要一步。 这一引擎是基于 Golang 编程语言开发,旨在大幅提高本地推理的精度,同时增强大型图像处理的能力。 新引擎的亮点在于其引入了图像处理元数据、KVCache 优化及图像缓存功能。
自动化研究与工具调用:Minion-Agent集成浏览器操作与MCP的智能任务框架
近日,一款名为Minion-Agent的AI智能体框架在社交媒体平台X上引发广泛关注。 这款集成了浏览器操作、MCP(Model Context Protocol)、自动工具调用、任务规划和深度研究等多种功能的智能体框架,正以其强大的自动化能力和灵活的应用场景成为AI领域的焦点。 Minion-Agent的核心能力Minion-Agent被誉为“AI助手制作套装”,其核心在于能够根据用户指令,自主完成复杂的任务流程。
OpenAI 计划在阿布扎比建造超大数据中心,规模远超摩纳哥
近日,OpenAI 与阿联酋科技公司 G42达成合作,将在阿布扎比建设一个规模巨大的数据中心园区。 这个项目将耗电达5000兆瓦,园区面积达到10平方英里,规模将成为全球最大的 AI 基础设施之一,甚至超过摩纳哥的整体面积。 这项新建的数据中心是 OpenAI “星际之门”(Stargate)计划的重要组成部分。
初创公司Firecrawl再次寻找AI代理员工,预算100万美元
Y Combinator支持的初创公司Firecrawl再次启动了招聘AI代理的计划,为此专门拨款100万美元。 该公司在YC招聘平台上发布了三个"仅限AI代理"的职位,包括内容创作代理、客服工程师和初级开发代理,每个职位月薪均为5000美元。 据Firecrawl创始人Caleb Peffer向TechCrunch透露,新职位发布约一周内就收到了约50份申请。
Anthropic获得25亿美元信贷支持,年收入激增至20亿美元
近日,人工智能公司 Anthropic 宣布获得了一项高达25亿美元的五年期循环信贷额度,此举旨在增强公司的财务流动性并推动业务扩展。 这家由前 OpenAI 高管创立的公司,其聊天机器人 Claude 自2023年推出以来,迅速在市场上获得了广泛关注和认可。 据悉,Anthropic 的估值已达615亿美元,而在2023年第一季度,其年化收入更是翻倍至20亿美元,显示出公司在竞争激烈的 AI 领域中正以惊人的速度成长。
Stability AI与Arm推出手机级音频生成AI:7秒内创建11秒立体声
Stability AI和Arm联合发布了一款名为"稳定音频开放小型"(Stable Audio Open Small)的紧凑型文本转音频模型,该模型能够在约7秒内生成长达11秒的高质量立体声音频片段,且经过优化可在智能手机等移动设备上运行。 这一突破基于加州大学伯克利分校研究人员开发的"对抗相对对比"(Adversarial Relativistic-Contrastive,ARC)技术。 该模型在高端硬件如Nvidia H100GPU上的表现更为惊人,能够在仅75毫秒内完成44kHz立体声音频的生成,实现了近乎实时的音频合成能力。
张朝阳:如果晚生 30 年,自己也会卷入到AI里面
在最近召开的2025搜狐科技年度论坛上,搜狐创始人、董事局主席兼首席执行官张朝阳,与清华大学讲席教授张亚勤及猎豹移动董事长兼 CEO 傅盛等三位科技领域的重量级嘉宾进行了深入的讨论。 论坛围绕人工智能(AI)、人形机器人和脑科学等前沿科技展开,吸引了众多关注。 图源备注:图片由AI生成,图片授权服务商Midjourney张朝阳在讨论中表示,如果晚生30年,自己也会卷入到AI里面,包括人形机器人,脑科学。
研究:AI 聊天机器人在数据总结能力上愈加糟糕,关键细节常被遗漏
随着人工智能技术的迅猛发展,各大 AI 创业公司不断宣称其产品将工作方式和知识获取的方式。 然而,最近一项发表在《皇家学会》上的研究却揭示了新一代 AI 模型在总结文本时存在严重问题,令人担忧。 研究显示,新款 AI 聊天机器人在提供信息时,有高达73% 的概率会遗漏关键信息。
中国移动发布 AI 通话系列产品:电话智能摘要、通话 MV、多模态助理
广东移动于 5 月 15 日举行移起 AI —— 2025 年三大服务计划发布会,并举行 AI 终端生态联盟启动仪式。
使用 Unsloth 高效微调 Qwen3,国产大模型的轻量化和部署实践
近年来,大语言模型在自然语言处理任务中取得了显著进展。 然而,对于开发者和中小型企业,模型微调的资源需求仍是一个挑战。 本文将讨论如何利用 Unsloth 框架,在有限的硬件资源下完成 Qwen3-14B 的高效微调,并支持后续部署。
深入 GraphRAG:构建更强大的知识增强问答系统的六大开源项目
前几天我分享了一篇文章知识图谱 向量数据库:打造更智能的RAG系统,介绍了如何把知识图谱和RAG系统相结合,来提升检索内容的准确性。 然后有读者询问我是否有相关的开源项目推荐,我整理了下,目前有6个关注比较高的图RAG项目,大家可以关注学习一下。 Microsoft GraphRAG微软官方发布的 GraphRAG 是一个构建在 LLM 与图机器学习结合基础上的检索增强生成系统。