AI新词
语音AI的终极突破!Bland TTS一键克隆任意人声,真实到让人毛骨悚然!
人工智能语音合成技术迎来重大突破!AIbase从社交媒体平台获取最新信息,了解到Bland AI正式发布了其全新Bland TTS引擎,号称首个跨越“恐怖谷”的语音AI技术。 这一引擎利用大型语言模型(LLM)直接生成语音,仅需一个短音频即可实现任意人声克隆,并支持语调、节奏等风格的灵活“混搭”。 本文将为您深入解析Bland TTS的创新功能及其对AI语音应用的深远影响。
6/5/2025 2:00:55 PM
AI在线
米其林星级餐厅用AI设计菜谱引争议:千元晚餐竟是ChatGPT"创作"?
当获奖厨师Grant Achatz宣布使用ChatGPT为其芝加哥米其林星级餐厅Next设计九道菜菜谱时,餐饮界掀起了一场关于AI是否应该介入创意烹饪的激烈辩论。 这一争议源于一个看似无害的社交媒体现象。 2024年10月,一家名为Ethos的奥斯汀"餐厅"在Instagram上走红,数千粉丝被其展示的无皮披萨球和尘螨面包等奇异菜品吸引。
6/5/2025 10:01:10 AM
AI在线
Reddit起诉Anthropic非法抓取数据训练Claude:要求删除所有含Reddit内容的AI模型
Reddit已在旧金山高等法院对人工智能公司Anthropic提起诉讼,指控其未经许可系统性抓取Reddit帖子训练Claude语言模型,违反平台用户协议和商业使用规定。 这起诉讼凸显了AI训练数据获取的法律争议,以及内容平台与AI公司之间日益紧张的关系。 Reddit要求法院强制Anthropic删除所有包含Reddit内容的AI模型和数据集,并禁止其将基于Reddit数据训练的AI模型用于商业用途。
6/5/2025 9:00:55 AM
AI在线
Epic 创新!《堡垒之夜》引入生成式 AI,轻松定制智能 NPC
在最近的 “State of Unreal” 主题发布会上,Epic Games 首次展示了其最新技术,允许《堡垒之夜》的创作者使用生成式 AI 工具定制个性化的非玩家角色(NPC)。 这一功能的亮点在于,只需大约20行提示文本,开发者就能创建出能自由互动的 NPC,赋予他们独特的性格、语音和语气。 根据外媒 Engadget 的报道,演示中的 NPC 被命名为 “Buttons 先生”,其唯一的任务是劝说玩家按下房间中央的一个大红按钮。
6/4/2025 5:00:54 PM
AI在线
Komiko视频到视频功能炸裂上线!AI一键打造动漫大片,漫画动画创作从未如此简单
Komiko平台宣布推出全新视频到视频(Video-to-Video)功能,进一步巩固其作为AI驱动的漫画、动画和插画一体化创作平台的领先地位。 这一功能结合AI线稿上色、背景移除、图像增强和动画补帧技术,让用户仅需几分钟即可创作出专业品质的漫画和动画作品。 AIbase为您深度解析Komiko的最新突破及其对创意产业的深远影响。
6/4/2025 4:00:54 PM
AI在线
AI 教父本吉奥宣布创建 “科学家 AI” 系统,致力于防范智能体欺骗
著名计算机科学家、被誉为 AI “教父” 的约书亚・本吉奥(Yoshua Bengio)近日宣布成立一个名为 LawZero 的非营利组织,目标是开发一种 “诚信” 人工智能系统,以防止 AI 智能体对人类实施欺骗行为。 6月3日,本吉奥在新闻发布会上透露,该组织将专注于打造一套安全防护机制,确保 AI 在运行过程中不会试图欺骗用户或进行自我保护,例如逃避被关闭的情况。 图源备注:图片由AI生成,图片授权服务商Midjourney本吉奥作为 LawZero 的主席,已为此项目提供了约3000万美元的启动资金,并组建了一支由十几名研究人员组成的团队。
6/4/2025 3:00:54 PM
AI在线
击败GPT-4o!Phonely语音AI突破99.2%准确率,客户中心裁员350人
在AI语音客服领域的一个关键技术障碍——延迟和不自然的对话体验,终于被打破。 人工智能电话支持公司 Phonely、推理优化平台 Maitai 以及芯片制造商 Groq 三方联合,打造出一套可实时切换模型、响应快如人类的电话AI系统,推动语音AI进入“拟人新纪元”。 据披露,通过此次合作,Phonely 的响应速度提升超过70%,AI对话准确率从81.5% 提升至99.2%,超越 GPT-4o 的94.7% 基准。
6/4/2025 11:00:54 AM
AI在线
斯坦福最新评测:DeepSeek R1医疗AI模型超越Google和OpenAI,赢得高分
近日,斯坦福大学发布了一项有关临床医疗 AI 模型的全面评测,DeepSeek R1以66% 的胜率和0.75的宏观平均分,在九个前沿大模型中脱颖而出,成为冠军。 这一评测的亮点在于,它不仅关注传统医疗执照考试题,更深入到临床医生的日常工作场景,给出了更切实的评估。 评测团队构建了一个名为 MedHELM 的综合评估框架,包含35个基准测试,覆盖22个医疗任务子类别。
6/4/2025 11:00:54 AM
AI在线
Claude Code或将向Pro用户开放
Anthropic开发的AI编码助手Claude Code自发布以来,以其强大的代码库理解能力和终端集成特性受到开发者热捧。 近期网络动态显示,Anthropic可能计划将Claude Code扩展至Claude Pro用户,打破此前仅限Max订阅或API用户的限制。 这一举措有望大幅降低使用门槛,让更多开发者体验到AI驱动的编码效率提升。
6/4/2025 11:00:54 AM
AI在线
OpenAI升级AI智能体开发工具,支持TypeScript 、改进语音对话
OpenAI 宣布对其 AI 智能体开发工具进行了一系列重要升级。 此次更新不仅提升了平台的兼容性,还对语音界面进行了优化,同时增强了可观测性(observability),使得开发者在构建 AI 智能体时能更加得心应手。 OpenAI 为其 Agents SDK 新增了对 TypeScript 的支持。
6/4/2025 10:01:25 AM
AI在线
Anthropic 开设一门关于使用 MCP 构建 AI 应用程序免费课程
人工智能技术的快速发展为开发者提供了无限可能,而如何高效连接AI模型与外部数据源成为行业关注的焦点。 近日,Anthropic与DeepLearning.AI合作推出了一门免费课程——“MCP:使用模型上下文协议构建富上下文AI应用”。 该课程旨在帮助开发者掌握Model Context Protocol(MCP),通过标准化协议简化AI应用与外部工具和数据的连接。
6/4/2025 10:01:25 AM
AI在线
中国知网推出CNKI AI 具备四大核心能力
近日,中国知网全面拥抱人工智能技术,推出全新探索成果——CNKI AI,此举旨在赋能知识服务,推进问答式增强检索和生成式知识服务的场景实践。 CNKI AI平台依托AI技术驱动,融合专业知识与深度思考,提供可信增强与可控生成的智能化服务。 它将AI学术研究助手与AI增强检索全面整合,使理解更为精准全面,解答更具专业深度,致力于构建人工智能时代学术研究、科技创新、科学决策、全民阅读和人才培养的新模式。
6/4/2025 9:01:04 AM
AI在线
Meta 计划用 AI 实现广告创作全面自动化
Meta 平台公司(前身为 Facebook)正在大力推进广告领域的人工智能(AI)应用,旨在到明年年底之前,让品牌能够完全通过 AI 来创作和投放广告。 这一计划是 Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)对公司未来愿景的重要组成部分,预计将彻底改变企业与消费者之间的广告互动方式。 据内部人士透露,Meta 正在开发一套先进的 AI 工具,这些工具能够帮助品牌在没有人力干预的情况下,自动生成广告内容并进行精准的受众定位。
6/3/2025 6:00:54 PM
AI在线
英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍
近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。 这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。 扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。
6/3/2025 2:00:54 PM
AI在线
Cerebras 推理 API 全面开放,开发者每日获百万免费 Token
2025年6月2日,人工智能芯片公司 Cerebras Systems 宣布,其推理 API 现已对所有开发者全面开放,取消了此前的等待名单限制。 这一举措标志着 Cerebras 在加速生成式 AI 应用开发方面迈出了重要一步,为全球开发者提供高效、快速的 AI 推理服务。 据 Cerebras 官方声明,开发者每日可免费获得100万个 Token 的使用额度。
6/3/2025 11:00:33 AM
AI在线
内幕曝光:苹果拥有媲美ChatGPT的 1500 亿参数AI模型却拒绝发布
据苹果内部消息人士马克·古尔曼透露,在Apple Intelligence推出一年后,即将于 6 月 9 日举行的苹果年度开发者大会(WWDC)将暴露出这家科技巨头在人工智能领域的战略困境。 开放"缩水版"模型,核心技术秘而不宣WWDC的AI重头戏将是向第三方开发者开放苹果自研的基础模型。 然而,这些可在苹果设备上运行的模型仅拥有约 30 亿个参数,在当前行业标准下规模偏小,性能表现也相对有限,主要支持文本摘要等基础功能。
6/3/2025 10:01:04 AM
AI在线
马斯克的 xAI 公司启动 3 亿美元股票出售计划,估值高达 1130 亿美元
根据《金融时报》的报道,埃隆・马斯克(Elon Musk)旗下的人工智能初创公司 xAI 正在启动一项价值 3 亿美元的股票出售计划。 这项计划被认为是在二级市场进行的,目的是为了让公司员工能够将股份出售给新投资者。 此次股票出售的估值达到了 1130 亿美元(约合 8136.7 亿元人民币),显示出市场对 xAI 的高度关注。
6/3/2025 9:01:05 AM
AI在线
通义开源视觉感知多模态RAG推理框架VRAG-RL
近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿等视觉语言中检索关键信息并进行精细化推理的难题。 在复杂视觉文档知识库中检索并推理关键信息,一直是AI领域的一大挑战。 传统的检索增强型生成(RAG)方法在处理视觉丰富信息时显得力不从心,主要因为它们难以应对图像、图表等视觉内容,且现有视觉RAG方法受限于固定的检索-生成流程,难以充分挖掘视觉信息中的关键知识。
5/31/2025 10:00:54 AM
AI在线
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭“限流”
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
AI设计
Claude
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
Transformer
LLM
字节跳动
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构