应用
Spark-TTS:用AI让声音“克隆”和“定制”成为现实!
在科技飞速发展的今天,人工智能已经渗透到我们生活的方方面面,从智能语音助手到各种自动化服务,AI正在以一种前所未有的方式改变我们的生活。 今天,我要给大家介绍一项超级酷炫的技术——Spark-TTS,一个基于Qwen2.5模型的高效文本转语音系统。 它不仅能“克隆”你的声音,还能根据你的需求“定制”出全新的声音!是不是听起来很神奇?什么是Spark-TTS?Spark-TTS是一种新型的文本转语音(TTS)系统,它的核心是BiCodec——一种单流语音编解码器。
3/7/2025 2:54:00 PM
AI在线
Manus 回应官方 X 账号被冻结:可能与第三方提及加密货币诈骗有关,正在对冒名者采取法律行动
今日,这两天走红的 AI 应用 Manus 在 X 平台的官方账号被冻结。Manus 联合创始人兼首席科学家季逸超今天发文称,Manus 的官方 X 账户被意外暂停,正积极与 X 的支持团队合作解决此事。初步观察表明,暂停可能与第三方提及加密货币诈骗有关,该领域与 Manus 的运营完全无关。
3/7/2025 2:44:58 PM
远洋
三小时复刻Manus!OpenManus横空出世,斩获GitHub 3000+星标
Manus的出现间接引发了开源界复刻竞赛,除了AIbase分享的CAMEL-AI0天复刻Manus通用智能体OWL以外,一个名为OpenManus的项目仅仅凭借三小时的代码量,也实现了Manus复刻。 就在昨天晚上,这个无需任何邀请即可使用的OpenManus在GitHub上横空出世,截止发稿时间,已经斩获3.3千GitHub星标,可谓是“出道即巅峰”。 其中最引人注目的莫过于那句简洁有力的宣言:“只需修改config.toml即可开玩”。
3/7/2025 2:35:00 PM
AI在线
Mistral AI 推出最强文档识别模型 Mistral OCR:革新文档理解新标杆
人工智能公司 Mistral AI 今日宣布,其最新文档识别模型 Mistral OCR 正式上线。 这一模型被誉为“地表最强 OCR”,以其卓越的性能和多功能性在 X 平台上引发热烈讨论。 Mistral OCR 支持复杂 PDF、图像、表格、数学公式及多语言文档的精确提取,并在速度和准确性上超越 Google Document AI 和 Azure OCR,成为文档处理领域的全新标杆。
3/7/2025 2:35:00 PM
AI在线
Manus回应官方X账号被冻结:与加密货币诈骗无关
Manus联合创始人兼首席科学家季逸超(Yichao Peak Ji)于3月7日在X平台发布声明,对公司官方账号(@ManusAI_HQ)被冻结一事作出回应。 声明表示该账号于前一天意外被冻结,公司目前正在积极与X团队合作解决这一问题。 季逸超在声明中指出,初步观察显示此次账号冻结可能与第三方提及的加密货币诈骗有关。
3/7/2025 2:22:00 PM
AI在线
饿了么启动本地生活AI算法大赛 瓜分30万元总奖金池
今日,饿了么宣布正式启动一场专注于本地生活领域的AI算法竞赛,旨在探索前沿技术如何推动具体应用创新,提高生活服务行业的效率和用户体验。 本次大赛设置智慧养老、智慧骑士和智算商效三大赛道,每个赛道将决出5个获胜队伍,共同瓜分30万元人民币的总奖金池。 其中一等奖奖金为50,000元人民币,二等奖30,000元人民币,三等奖10,000元人民币,以及两个各5,000元人民币的优胜奖。
3/7/2025 2:06:00 PM
AI在线
无代码 3D 创作工具Intangible融资400万美元
还在苦啃复杂的3D建模软件?你OUT啦!科技圈又爆出一个重磅消息,一款名为 Intangible 的AI神器横空出世,它就像一个拥有魔法棒的造物主,只需一句简单的文字指令,就能在你眼前瞬间构建出一个栩栩如生的3D世界!更炸裂的是,这款颠覆性工具还获得了高达400万美元的种子轮融资,预备六月正式上线,看来是要彻底革新创意产业的节奏!Intangible 的野心可不小,它要让3D创作不再是少数专业人士的“独门绝技”,而是变成人人都能掌握的“通用技能”。 无论是电影制作人、游戏设计师、活动策划,还是营销机构,甚至是对家居设计、艺术创作有想法的普通用户,都能借助 Intangible 轻松将脑海中的创意火花转化为可视化的3D场景。 这款神器的幕后推手也绝非等闲之辈,创始人 Charles Migos 可是苹果初代 iPad 应用 (iBooks, Notes, News) 的首席设计师,还曾担任 Unity 的产品开发副总裁,另一位联合创始人 Bharat Vasan 也是连续创业家,此前创立的可穿戴设备公司 Basis 被英特尔收购。
3/7/2025 2:04:00 PM
AI在线
阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜榜首
在全球最大的 AI 开源社区 HuggingFace 的最新更新中,阿里巴巴近期推出的通义千问推理模型 QwQ-32B 成功夺得了大模型榜单的第一名。 这一模型在刚发布后便引起了广泛关注,超越了诸如微软的 Phi-4和 DeepSeek-R1等知名模型,展现出了强大的性能。 QwQ-32B 模型在数学、代码处理及通用能力等多个方面都取得了质的飞跃,特别是其参数数量较小的特点,使得其整体性能能够与 DeepSeek-R1相媲美。
3/7/2025 1:58:00 PM
AI在线
别抢Manus邀请码了!CAMEL-AI 0天复刻Manus通用智能体OWL震撼登场
现在大家可以放弃追求Manus邀请码,目光转向开源社区!日前,CAMEL-AI团队宣布重磅推出的OWL(Optimized Workforce Learning)项目。 这款基于CAMEL-AI框架构建的创新性多智能体协作框架,以其卓越的性能和开放的精神,在自动化任务处理领域掀起了一股强劲的风暴。 GAIA榜单榜首要说OWL有多能打,数据最有说服力。
3/7/2025 1:48:00 PM
AI在线
饿了么首届 AI 算法大赛启动,今年将重点投入 AI 智能
饿了么宣布,今年将重点投入 AI 智能,持续探索前沿技术如何推动具体应用创新,公司将开启一场专注于本地生活领域的 AI 算法竞赛。
3/7/2025 1:46:00 PM
浩渺
微软 Copilot 用户现可免费无限制访问 OpenAI o3-mini-high 深度思考模型
微软今日宣布加强 Copilot Think Deeper 深度思考功能,现在由 OpenAI 的 o3-mini-high 模型提供支持。从本质上讲,微软正在将相当于 ChatGPT Pro 的等效推理模型下放到所有 Copilot 用户。
3/7/2025 1:24:50 PM
汪淼
Nature封面:探索真菌网络,用机器人进行高通量延时成像研究
编辑 | ScienceAI丛枝菌根(AM)共生关系是自然界中最为广泛的共生伙伴关系之一。 4.5 亿年来,菌根真菌构建了用于与植物根系交换养分资源的网络。 经过 4.5 亿年的自然选择,AM 网络的灵活性和响应性极强。
3/7/2025 1:16:00 PM
ScienceAI
不吹不黑,拿到邀请码一手实测Manus,还有人0天就复刻出了开源版
昨天,一个叫「Manus」的通用 AI Agent 产品引起热议。 它可以完成从文件处理、数据分析、代码编写到内容创作等多种任务,比如帮助用户生成旅行计划、分析股票数据、筛选简历或开发简单的网页游戏。 但是,由于「Manus」只发放了少量邀请码,能够体验到这款应用的人数目前还比较少。
3/7/2025 12:58:00 PM
机器之心
千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
法国大模型独角兽 Mistral AI 进军 OCR(光学字符识别)领域了。 一出手就是号称「世界上最好的 OCR 模型」! 新产品 Mistral OCR 是一种光学字符识别 API,它为文档理解树立了新标准。
3/7/2025 12:53:00 PM
机器之心
谷歌创始人拉里·佩奇出山成立大模型公司,目标智能制造
谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。 据外媒 The Information 本周四报道,拉里・佩奇成立了名为 Dynatomics 的创业公司,旨在用人工智能颠覆制造业。 有两位知情人士透露,佩奇和一小群工程师正在研究如何使用大语言模型(LLM)为各种物体创建高度优化的设计,然后让工厂制造它们。
3/7/2025 12:50:00 PM
机器之心
谷歌联合创始人佩奇成立新公司 Dynatomics,目标用 AI 革新制造业
拉里・佩奇是一个计算机科学家和互联网企业家,于 1998 年与谢尔盖・布林成立了谷歌公司。佩奇也是谷歌搜索排名算法 PageRank 的发明者。
3/7/2025 12:19:15 PM
汪淼
智源推出 BGE-VL 多模态向量模型,开启检索新纪元
在多模态人工智能领域,智源研究院与多所高校合作推出了全新的多模态向量模型 BGE-VL,标志着多模态检索技术的一次重大突破。 自发布以来,BGE 系列模型便获得了广泛赞誉,而 BGE-VL 的推出则进一步丰富了这一生态系统。 该模型在图文检索、组合图像检索等多项关键任务中表现出色,展现出其卓越的性能。
3/7/2025 11:46:00 AM
AI在线
前 OpenAI 政策负责人质疑公司 AI 安全叙事的变更
最近,前 OpenAI 政策研究负责人迈尔斯・布伦达奇(Miles Brundage)对公司在人工智能安全方面的叙事变更提出了批评,认为 OpenAI 正在重新编写其 AI 系统安全的历史。 他表示,OpenAI 在追求通用人工智能(AGI)的过程中,可能会忽视长远的安全措施。 OpenAI 一直以来致力于推动其雄心勃勃的愿景,尤其是在 DeepSeek 等竞争对手日益崛起的背景下。
3/7/2025 11:41:00 AM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
LLM
AI新词
蛋白质
开发者
腾讯
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用