应用
TEN VAD震撼开源:企业级语音检测神器,打造超智能AI语音助手!
近日,TEN Agent团队宣布将其企业级实时语音活动检测器(TEN VAD)正式开源,这一突破性举措引发行业热议。 TEN VAD以帧级精度的语音检测能力和优于WebRTC VAD及Silero VAD的性能表现,成为构建实时对话语音助手的强力引擎。 TEN VAD:帧级精度的企业级语音检测TEN VAD是一款基于深度学习的轻量级、低延迟语音活动检测(VAD)模型,专为企业级应用设计。
Chai-2震撼发布:AI驱动零样本抗体设计,药物研发提速百倍
人工智能在药物研发领域再掀波澜!Chai Discovery近日推出全新AI模型Chai-2,以其在分子设计领域的突破性技术引发广泛关注。 Chai-2实现了零样本抗体设计,成功率高达16%-20%,较传统方法提升超百倍,药物研发周期从数月甚至数年缩短至仅两周。 零样本抗体设计,突破传统瓶颈Chai-2是Chai Discovery开发的多模态生成式AI模型,专注于分子结构的预测与设计。
微软推出 AI 诊断工具 MAI-DxO:诊断复杂病例准确率 85.5%,超 21 位资深医生
微软公司昨日(6 月 30 日)发布博文,宣布推出 Microsoft AI Diagnostic Orchestrator(MAI-DxO)新 AI 工具,在诊断复杂病例方面击败了 21 位来自美国和英国,经验丰富的医生。
Meta 重组 AI 部门成立 MSL:未来几年投入数千亿美元,瞄准超级智能
彭博社今天(7 月 1 日)发布博文,报道称 Meta Platforms Inc.首席执行官马克・扎克伯格(Mark Zuckerberg)宣布重组公司人工智能部门,成立 Meta Superintelligence Labs(MSL),致力于开发能够比肩甚至超越人类能力的“超级智能”AI 系统。
Qwen-TTS重磅发布:方言语音合成新突破,真实感媲美真人
昨日,阿里巴巴通义团队正式推出了Qwen-TTS模型,这款文本转语音(TTS)模型以其超高真实感和多方言支持引发行业热议。 AIbase编辑团队整理最新信息,为您深入解析这款通过Qwen API提供服务的语音合成利器,及其在AI语音技术领域的突破性意义。 Qwen-TTS:超真实语音合成Qwen-TTS是通义团队基于大规模语音数据集研发的最新文本转语音模型,通过数百万小时的语音训练,生成的声音在自然度、韵律、节奏和情感表达上达到了极高水平。
TEN Agent开源TEN VAD与Turn Detection,助力语音AI超低延迟
TEN Agent团队近日宣布,其核心模型**TEN Voice Activity Detection (VAD)**和**TEN Turn Detection**正式开源,为构建实时、多模态的语音AI代理提供了强大的技术支持。 这一举措标志着TEN框架在推动语音交互技术民主化与开源协作方面的重大进展。 以下是AIbase整理的最新资讯,深入解析这两大核心模型的功能、优势及对行业的潜在影响。
字节发布创新图像合成技术XVerse:对多个个体进行独立且精确的控制
近日,字节 正式发布其最新图像合成技术 ——XVerse,旨在提供高精度的多主体图像生成解决方案。 这项创新的技术使得用户能够对多个个体进行独立且精确的控制,极大地提升了个性化和复杂场景生成的能力。 XVerse 的核心在于其独特的 DiT 调制方法,能够在不影响整体图像潜在特征的情况下,对每个主体的身份和语义属性进行调控。
Chai Discovery发布Chai- 2 模型:零样本抗体设计突破16-20%命中率
Chai Discovery于2025年6月30日推出全新AI模型Chai-2,标志着抗体设计领域的重大突破。 Chai-2以零样本抗体设计能力著称,实验命中率达16-20%,远超传统方法的0.1%行业标准,为生物制药研发注入新动力。 Chai-2采用多模态生成架构,整合全原子结构预测与生成式建模,可在仅提供目标结构和表位的情况下,从头设计抗体的互补决定区(CDR)。
AI动画神器ManimML:解锁Transformer架构的直观可视化
随着人工智能技术的飞速发展,复杂的机器学习模型如Transformer架构逐渐成为研究和应用的热点。 然而,如何将这些抽象的概念以直观的方式呈现给大众,成为了技术传播中的一大挑战。 近日,AI动画库ManimML引发广泛关注,其强大的可视化功能让复杂的神经网络架构变得通俗易懂。
Cursor发布Web版,AI编码工具扩展至浏览器与移动端
据AIbase报道,Anysphere于2025年6月30日推出Cursor Web版及移动版,将AI编码代理从桌面IDE扩展至浏览器和移动设备,为开发者提供更灵活的编程体验。 这一更新标志着Cursor在AI编码领域的重大突破。 Cursor Web版通过cursor.com/agents支持开发者在桌面、平板或手机上管理多个AI编码代理,涵盖代码审查、错误修复和功能构建等任务。
OpenAI:正对谷歌 TPU 进行早期测试,暂无大规模部署计划
AI 硬件从实验室测试到大规模商用部署间仍有一段路要走。OpenAI 也在开发自研 AI ASIC。
Cursor手机版震撼发布!随时随地编码,开发者迎来新自由
人工智能驱动的编程工具Cursor近日迎来重大更新,正式推出Web版与移动版支持,为开发者带来全新的移动端编程体验。 这一突破性进展打破了传统桌面端限制,让编程工作更加灵活高效。 以下是AIbase整理的最新资讯,带您深入了解Cursor手机版的亮点与影响。
OpenAI 澄清与谷歌芯片传闻:并无大规模合作计划
美国人工智能初创公司 OpenAI 近日对外发布声明,否认了媒体有关其计划采用谷歌自研芯片的报道。 这一声明是在媒体两天前的相关消息引发广泛关注后发布的。 OpenAI 的一位发言人在周日表示,尽管该公司正在对谷歌的张量处理单元(TPU)进行早期测试,但目前并没有大规模使用这些芯片的打算。
英特尔助力百度文心大模型 4.5,实现端侧部署
6月30日,百度正式开源了其最新的文心大模型4.5系列,包含了多达10款模型,其中包括47B 和3B 激活参数的混合专家模型(MoE)以及0.3B 参数的稠密型模型。 这次开源不仅让开发者能够免费使用这些强大的模型,还提供了预训练权重和推理代码,方便开发者进行各种应用。 而在此次发布中,英特尔也展现了其强大的技术支持。
特斯拉首次实现客户车辆“自动驾驶交付”,奥斯汀之路挑战重重
在奥斯汀推出有限的自动驾驶出租车服务仅几天后,特斯拉再次展示了其自动驾驶软件的最新进展。 一辆 Model Y SUV 在无人干预的情况下,完成了从特斯拉工厂到新车主公寓楼的约15英里行程,首席执行官埃隆·马斯克称之为首次客户汽车“自动驾驶交付”。 据称,这辆 Model Y 搭载了与特斯拉奥斯汀自动驾驶出租车相同的软件,但在交付时被降级为市售的全自动驾驶(监督)软件,该软件要求驾驶员保持专注并随时准备接管。
特斯拉全自动驾驶交付视频震撼发布:从工厂到客户家全程无人驾驶!
特斯拉再次引领汽车行业技术革命!近日,特斯拉发布了全球首个人工智能(AI)全自动驾驶(FSD)从工厂到客户家中的交付视频,展示了其自动驾驶技术的最新突破。 这段全程17英里、约30分钟的无人驾驶旅程,跨越停车场、高速公路和城市道路,最终将车辆精准送达新车主家中。 全程无人驾驶,技术里程碑特斯拉此次发布的视频展示了其FSD系统在真实场景中的惊人表现。
谷歌全新 “Gemini 教育项目” 助力校园 AI 应用,教师学生皆受益!
在最新的国际教育技术协会(ISTE)年会上,谷歌宣布了一项令人振奋的新计划 ——“Gemini for Education”。 这一项目旨在为教师和学生提供强大的人工智能工具,助力教育的发展。 谷歌表示,这款 Gemini 教育版本将免费集成到现有的教育方案中,确保学校无需支付额外费用即可使用其高级的 Gemini2.5Pro 模型。
甲骨文受到云计算和大模型影响,股价飙升创历史新高
甲骨文公司(Oracle)近日公布的一项云计算重磅交易,预计将为其每年带来逾300亿美元的收入,消息一出,公司股价随即上涨4%,并创下历史新高。 根据提交给美国证券交易委员会(SEC)的文件,首席执行官萨弗拉·卡兹(Safra Catz)预计将在周一的公司会议上正式宣布这项备受瞩目的交易。 该交易的收入预计将从2028财年开始体现在甲骨文的财报中。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉