资讯列表
ElevenLabs推全新语音交互平台Conversational AI 2.0:AI语音助手比真人还懂你
近日,ElevenLabs正式推出了其全新一代语音交互平台Conversational AI2.0,以更自然、更智能、更高效的语音交互体验引发业界热议。 这一升级版本在对话流畅性、多语言支持和企业级应用能力上实现重大突破,不仅能精准捕捉用户对话节奏,还能无缝切换多语言并从企业知识库提取信息,为客服、营销和内容创作等领域带来全新可能。 自然对话新体验:告别尴尬中断Conversational AI2.0引入了先进的轮流对话模型,通过实时分析用户的语音提示(如“呃”“嗯”等),精准判断何时发言、何时等待,从而避免传统语音系统中常见的尴尬停顿或不合时宜的打断。
6/3/2025 11:00:54 AM
AI在线
Cerebras 推理 API 全面开放,开发者每日获百万免费 Token
2025年6月2日,人工智能芯片公司 Cerebras Systems 宣布,其推理 API 现已对所有开发者全面开放,取消了此前的等待名单限制。 这一举措标志着 Cerebras 在加速生成式 AI 应用开发方面迈出了重要一步,为全球开发者提供高效、快速的 AI 推理服务。 据 Cerebras 官方声明,开发者每日可免费获得100万个 Token 的使用额度。
6/3/2025 11:00:33 AM
AI在线
小米向月之暗面转让多枚“Kimi”商标
小米近日将多枚“Kimi”商标转让给北京月之暗面公司,后者为AI助手Kimi的开发者。此次转让或为小米优化非核心商标资源,月之暗面近期动作频繁,包括与小红书合作等。#小米商标转让# #AI助手Kimi#
6/3/2025 10:51:50 AM
远洋
我国水利标准 AI 大模型正式发布,采用海量知识库 + DeepSeek / Qwen 双模型
我国水利标准AI大模型正式发布,采用海量知识库+DeepSeek/Qwen双模型,实现水利标准全生命周期数字化、智能化管理。查重比对准确率超96.7%,标准编制效率提高2.5倍。#水利科技##AI大模型#
6/3/2025 10:04:47 AM
远洋
Meta 公司将90% 的风险评估交给 AI,安全隐患引发担忧
近日,Meta 公司(Facebook、Instagram、WhatsApp 及 Threads 的母公司)宣布将其内部的安全和隐私审查工作转向人工智能,计划让高达90% 的风险评估自动化。 根据《国家公共广播电台》(NPR)获得的内部文件,以往由专门团队负责评估更新对用户隐私的影响、对未成年人的伤害,或者对错误信息传播的影响,现在这些责任将主要转移给 AI 技术。 在新的评估框架下,产品团队需填写一份问卷,详细描述更新内容,随后 AI 系统将即时给出评估结果,指出潜在风险并设定项目所需的条件。
6/3/2025 10:01:10 AM
AI在线
谷歌推出AI Edge Gallery应用,实现离线智能手机AI处理
谷歌近期悄然推出了一款名为 AI Edge Gallery 的实验性 Android 应用,允许用户在不连接互联网的情况下直接在智能手机上运行复杂的人工智能模型。 这标志着谷歌在边缘计算和隐私保护方面迈出了重要一步。 AI Edge Gallery 应用支持用户从知名的 Hugging Face 平台下载和执行 AI 模型,能够实现图像分析、文本生成、编程辅助和多轮对话等功能,且所有数据处理均在本地完成,增强了用户的隐私保护。
6/3/2025 10:01:09 AM
AI在线
梦工厂创始人卡岑伯格牵头 1500 万美元融资,推出 AI 视频广告平台 Creatify
梦工厂的联合创始人杰弗里・卡岑伯格(Jeffrey Katzenberg)通过他的风险投资基金 WndrCo,联合领导了一轮1500万美元的 A 轮融资,投资于 AI 视频广告平台 Creatify。 Creatify 的 AdMax 平台利用人工智能快速生成多种视频广告,特别针对社交媒体营销。 该平台能够分析 TikTok 和 Instagram 等应用上表现优异的视频广告活动,从而优化其输出内容。
6/3/2025 10:01:04 AM
AI在线
中国脑机接口临床入组提速,攻克瘫痪与失语
2025年是中国脑机接口技术临床应用的关键之年。 在政策支持下,北京、上海等地积极布局产业,计划在2030年前完成多款侵入式产品临床试验。 近期,上海华山医院院长毛颖透露,由华山医院和北京宣武医院牵头的脑机接口临床队列研究已启动患者入组,旨在验证植入式方案的有效性和安全性。
6/3/2025 10:01:04 AM
AI在线
昔日巨头 Digg 归来:以零知识证明对抗机器人,构建创作者友好型社区
在人工智能生成内容日益泛滥、威胁淹没真实人类声音的当下,昔日的新闻聚合巨头 Digg 正试图以全新的面貌回归,重拾早期互联网的社区精神。 创始人 Kevin Rose 和 Reddit 联合创始人 Alexis Ohanian 联手,希望将 Digg 打造成一个属于人工智能时代的社交平台,在这个平台上,内容创造者和社区管理者将从平台的成功中获得更直接的回报。 Digg 曾是 Web2.0时代的明星,2008年估值一度高达1.75亿美元。
6/3/2025 10:01:04 AM
AI在线
犹他州律师因引用ChatGPT生成虚假案例遭法庭处罚,AI 应用引发争议
近日,美国犹他州一名律师理查德・贝德纳因在法庭文件中引用由 ChatGPT 生成的虚假案例而遭到法院的制裁。 据《卫报》报道,这起事件引发了对人工智能在法律领域应用的广泛讨论。 贝德纳与同事道格拉斯・杜尔巴诺共同提交了一份上诉申请,但在审查过程中,发现文中引用了多个不存在的法律判例。
6/3/2025 10:01:04 AM
AI在线
Hume AI重磅发布EVI 3:懂你情绪的语音AI,比GPT-4o还快!
近日,Hume AI正式发布了其第三代语音交互模型EVI3,这一全新语音AI以其卓越的情感理解能力和个性化交互体验引发业界广泛关注。 EVI3不仅能精准识别用户语音中的情绪,还能根据用户喜好生成特定风格的声音和个性,标志着语音AI在情感交互和自然沟通领域的重大突破。 以下,AIbase为您带来关于EVI3的最新资讯和深度解析。
6/3/2025 10:01:04 AM
AI在线
Getty Images CEO 谈 AI 版权诉讼:诉讼费用难以承受
Getty Images首席执行官克雷格・彼得斯(Craig Peters)在最近接受 CNBC 采访时表示,作为一家大型图像版权公司,Getty Images在面对人工智能技术引发的版权争议时,面临着巨大的财务压力。 他指出,即使是像盖蒂这样的大公司,也难以承担每一宗侵权案件的诉讼费用。 彼得斯提到,Getty Images目前正在对生成图片的人工智能公司 Stability AI 提起诉讼,原因是该公司未经授权,使用了Getty Images的1200万张图片用于训练其 AI 系统。
6/3/2025 10:01:04 AM
AI在线
内幕曝光:苹果拥有媲美ChatGPT的 1500 亿参数AI模型却拒绝发布
据苹果内部消息人士马克·古尔曼透露,在Apple Intelligence推出一年后,即将于 6 月 9 日举行的苹果年度开发者大会(WWDC)将暴露出这家科技巨头在人工智能领域的战略困境。 开放"缩水版"模型,核心技术秘而不宣WWDC的AI重头戏将是向第三方开发者开放苹果自研的基础模型。 然而,这些可在苹果设备上运行的模型仅拥有约 30 亿个参数,在当前行业标准下规模偏小,性能表现也相对有限,主要支持文本摘要等基础功能。
6/3/2025 10:01:04 AM
AI在线
NUS 推出 OmniConsistency:低成本实现图像风格化一致性,挑战 GPT-4o!
近日,新加坡国立大学(NUS)团队发布了一个名为 “OmniConsistency” 的创新项目,旨在以极低的成本复现 OpenAI 的 GPT-4o 模型在图像风格化上的一致性。 这项技术不仅解决了当前开源社区在图像风格化和一致性之间的矛盾,还为广大开发者提供了可行的解决方案。 近年来,图像风格化的技术不断发展,但在实际应用中,风格与内容一致性之间的平衡一直是个难题。
6/3/2025 10:01:04 AM
AI在线
AI 攻击 AI:全球超 1.7 万 Open WebUI 实例被入侵,威胁 Linux 和 Win10 / Win11 用户
网络安全公司 Sysdig 示警,有攻击者利用配置不当的 Open WebUI 实例,通过 AI 生成的恶意软件入侵系统,威胁 Linux 和 Windows 用户。
6/3/2025 9:38:37 AM
故渊
极简设计铸就卓越性能:Alita 通用智能体的进化思考
大家好,我是肆〇柒。 今天,我要和大家聊一篇极具创新性的论文 ——《ALITA: GENERALIST AGENT ENABLING SCALABLE AGENTIC REASONING WITH MINIMAL PREDEFINITION AND MAXIMAL SELF-EVOLUTION》。 该论文由普林斯顿大学、清华大学、上海交通大学等多所顶尖高校等机构提出。
6/3/2025 9:31:16 AM
肆零柒
微信自研高性能推理计算引擎 XNet-DNN:跨平台 GPU 部署大语言模型及优化实践
作者 | yannicXNet-DNN 是微信高性能计算团队自主研发的一款全平台神经网络推理引擎。 我们在 XNet 的 RCI 基础设施之上构建了全平台的 GPU LLM . 推理能力。
6/3/2025 9:25:00 AM
腾讯技术工程
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
这个对人类来说非常简单的问题,连GPT-4o这样级别的视觉语言大模型(VLMs)也可能答错。 究其根本,还是当前的视觉语言大模型在大规模图文数据中学习到的空间信息往往是片段化的,仅限于静态视角的理解,缺乏多维度、多视角的空间推理能力。 因此,当面对需要多视角空间推理的任务时,这些模型们就频频卡壳。
6/3/2025 9:16:00 AM