AI在线 AI在线

AI新词

语音AI的终极突破!Bland TTS一键克隆任意人声,真实到让人毛骨悚然!

人工智能语音合成技术迎来重大突破!AIbase从社交媒体平台获取最新信息,了解到Bland AI正式发布了其全新Bland TTS引擎,号称首个跨越“恐怖谷”的语音AI技术。 这一引擎利用大型语言模型(LLM)直接生成语音,仅需一个短音频即可实现任意人声克隆,并支持语调、节奏等风格的灵活“混搭”。 本文将为您深入解析Bland TTS的创新功能及其对AI语音应用的深远影响。
6/5/2025 2:00:55 PM
AI在线

米其林星级餐厅用AI设计菜谱引争议:千元晚餐竟是ChatGPT"创作"?

当获奖厨师Grant Achatz宣布使用ChatGPT为其芝加哥米其林星级餐厅Next设计九道菜菜谱时,餐饮界掀起了一场关于AI是否应该介入创意烹饪的激烈辩论。 这一争议源于一个看似无害的社交媒体现象。 2024年10月,一家名为Ethos的奥斯汀"餐厅"在Instagram上走红,数千粉丝被其展示的无皮披萨球和尘螨面包等奇异菜品吸引。
6/5/2025 10:01:10 AM
AI在线

Reddit起诉Anthropic非法抓取数据训练Claude:要求删除所有含Reddit内容的AI模型

Reddit已在旧金山高等法院对人工智能公司Anthropic提起诉讼,指控其未经许可系统性抓取Reddit帖子训练Claude语言模型,违反平台用户协议和商业使用规定。 这起诉讼凸显了AI训练数据获取的法律争议,以及内容平台与AI公司之间日益紧张的关系。 Reddit要求法院强制Anthropic删除所有包含Reddit内容的AI模型和数据集,并禁止其将基于Reddit数据训练的AI模型用于商业用途。
6/5/2025 9:00:55 AM
AI在线

​Epic 创新!《堡垒之夜》引入生成式 AI,轻松定制智能 NPC

在最近的 “State of Unreal” 主题发布会上,Epic Games 首次展示了其最新技术,允许《堡垒之夜》的创作者使用生成式 AI 工具定制个性化的非玩家角色(NPC)。 这一功能的亮点在于,只需大约20行提示文本,开发者就能创建出能自由互动的 NPC,赋予他们独特的性格、语音和语气。 根据外媒 Engadget 的报道,演示中的 NPC 被命名为 “Buttons 先生”,其唯一的任务是劝说玩家按下房间中央的一个大红按钮。
6/4/2025 5:00:54 PM
AI在线

Komiko视频到视频功能炸裂上线!AI一键打造动漫大片,漫画动画创作从未如此简单

Komiko平台宣布推出全新视频到视频(Video-to-Video)功能,进一步巩固其作为AI驱动的漫画、动画和插画一体化创作平台的领先地位。 这一功能结合AI线稿上色、背景移除、图像增强和动画补帧技术,让用户仅需几分钟即可创作出专业品质的漫画和动画作品。 AIbase为您深度解析Komiko的最新突破及其对创意产业的深远影响。
6/4/2025 4:00:54 PM
AI在线

​AI 教父本吉奥宣布创建 “科学家 AI” 系统,致力于防范智能体欺骗

著名计算机科学家、被誉为 AI “教父” 的约书亚・本吉奥(Yoshua Bengio)近日宣布成立一个名为 LawZero 的非营利组织,目标是开发一种 “诚信” 人工智能系统,以防止 AI 智能体对人类实施欺骗行为。 6月3日,本吉奥在新闻发布会上透露,该组织将专注于打造一套安全防护机制,确保 AI 在运行过程中不会试图欺骗用户或进行自我保护,例如逃避被关闭的情况。 图源备注:图片由AI生成,图片授权服务商Midjourney本吉奥作为 LawZero 的主席,已为此项目提供了约3000万美元的启动资金,并组建了一支由十几名研究人员组成的团队。
6/4/2025 3:00:54 PM
AI在线

击败GPT-4o!Phonely语音AI突破99.2%准确率,客户中心裁员350人

在AI语音客服领域的一个关键技术障碍——延迟和不自然的对话体验,终于被打破。 人工智能电话支持公司 Phonely、推理优化平台 Maitai 以及芯片制造商 Groq 三方联合,打造出一套可实时切换模型、响应快如人类的电话AI系统,推动语音AI进入“拟人新纪元”。 据披露,通过此次合作,Phonely 的响应速度提升超过70%,AI对话准确率从81.5% 提升至99.2%,超越 GPT-4o 的94.7% 基准。
6/4/2025 11:00:54 AM
AI在线

斯坦福最新评测:DeepSeek R1医疗AI模型超越Google和OpenAI,赢得高分

近日,斯坦福大学发布了一项有关临床医疗 AI 模型的全面评测,DeepSeek R1以66% 的胜率和0.75的宏观平均分,在九个前沿大模型中脱颖而出,成为冠军。 这一评测的亮点在于,它不仅关注传统医疗执照考试题,更深入到临床医生的日常工作场景,给出了更切实的评估。 评测团队构建了一个名为 MedHELM 的综合评估框架,包含35个基准测试,覆盖22个医疗任务子类别。
6/4/2025 11:00:54 AM
AI在线

Claude Code或将向Pro用户开放

Anthropic开发的AI编码助手Claude Code自发布以来,以其强大的代码库理解能力和终端集成特性受到开发者热捧。 近期网络动态显示,Anthropic可能计划将Claude Code扩展至Claude Pro用户,打破此前仅限Max订阅或API用户的限制。 这一举措有望大幅降低使用门槛,让更多开发者体验到AI驱动的编码效率提升。
6/4/2025 11:00:54 AM
AI在线

OpenAI升级AI智能体开发工具,支持TypeScript 、改进语音对话

OpenAI 宣布对其 AI 智能体开发工具进行了一系列重要升级。 此次更新不仅提升了平台的兼容性,还对语音界面进行了优化,同时增强了可观测性(observability),使得开发者在构建 AI 智能体时能更加得心应手。 OpenAI 为其 Agents SDK 新增了对 TypeScript 的支持。
6/4/2025 10:01:25 AM
AI在线

Anthropic 开设一门关于使用 MCP 构建 AI 应用程序免费课程

人工智能技术的快速发展为开发者提供了无限可能,而如何高效连接AI模型与外部数据源成为行业关注的焦点。 近日,Anthropic与DeepLearning.AI合作推出了一门免费课程——“MCP:使用模型上下文协议构建富上下文AI应用”。 该课程旨在帮助开发者掌握Model Context Protocol(MCP),通过标准化协议简化AI应用与外部工具和数据的连接。
6/4/2025 10:01:25 AM
AI在线

中国知网推出CNKI AI 具备四大核心能力

近日,中国知网全面拥抱人工智能技术,推出全新探索成果——CNKI AI,此举旨在赋能知识服务,推进问答式增强检索和生成式知识服务的场景实践。 CNKI AI平台依托AI技术驱动,融合专业知识与深度思考,提供可信增强与可控生成的智能化服务。 它将AI学术研究助手与AI增强检索全面整合,使理解更为精准全面,解答更具专业深度,致力于构建人工智能时代学术研究、科技创新、科学决策、全民阅读和人才培养的新模式。
6/4/2025 9:01:04 AM
AI在线

Meta 计划用 AI 实现广告创作全面自动化

Meta 平台公司(前身为 Facebook)正在大力推进广告领域的人工智能(AI)应用,旨在到明年年底之前,让品牌能够完全通过 AI 来创作和投放广告。 这一计划是 Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)对公司未来愿景的重要组成部分,预计将彻底改变企业与消费者之间的广告互动方式。 据内部人士透露,Meta 正在开发一套先进的 AI 工具,这些工具能够帮助品牌在没有人力干预的情况下,自动生成广告内容并进行精准的受众定位。
6/3/2025 6:00:54 PM
AI在线

英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍

近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。 这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。  扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。
6/3/2025 2:00:54 PM
AI在线

Cerebras 推理 API 全面开放,开发者每日获百万免费 Token

2025年6月2日,人工智能芯片公司 Cerebras Systems 宣布,其推理 API 现已对所有开发者全面开放,取消了此前的等待名单限制。 这一举措标志着 Cerebras 在加速生成式 AI 应用开发方面迈出了重要一步,为全球开发者提供高效、快速的 AI 推理服务。 据 Cerebras 官方声明,开发者每日可免费获得100万个 Token 的使用额度。
6/3/2025 11:00:33 AM
AI在线

内幕曝光:苹果拥有媲美ChatGPT的 1500 亿参数AI模型却拒绝发布

据苹果内部消息人士马克·古尔曼透露,在Apple Intelligence推出一年后,即将于 6 月 9 日举行的苹果年度开发者大会(WWDC)将暴露出这家科技巨头在人工智能领域的战略困境。 开放"缩水版"模型,核心技术秘而不宣WWDC的AI重头戏将是向第三方开发者开放苹果自研的基础模型。 然而,这些可在苹果设备上运行的模型仅拥有约 30 亿个参数,在当前行业标准下规模偏小,性能表现也相对有限,主要支持文本摘要等基础功能。
6/3/2025 10:01:04 AM
AI在线

马斯克的 xAI 公司启动 3 亿美元股票出售计划,估值高达 1130 亿美元

根据《金融时报》的报道,埃隆・马斯克(Elon Musk)旗下的人工智能初创公司 xAI 正在启动一项价值 3 亿美元的股票出售计划。 这项计划被认为是在二级市场进行的,目的是为了让公司员工能够将股份出售给新投资者。 此次股票出售的估值达到了 1130 亿美元(约合 8136.7 亿元人民币),显示出市场对 xAI 的高度关注。
6/3/2025 9:01:05 AM
AI在线

通义开源视觉感知多模态RAG推理框架VRAG-RL

近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。 在复杂视觉文档知识库中检索并推理关键信息,一直是AI领域的一大挑战。 传统的检索增强型生成(RAG)方法在处理视觉丰富信息时显得力不从心,主要因为它们难以应对图像、图表等视觉内容,且现有视觉RAG方法受限于固定的检索-生成流程,难以充分挖掘视觉信息中的关键知识。
5/31/2025 10:00:54 AM
AI在线