资讯列表
B站文本转语音模型IndexTTS :支持拼音纠正汉字发音、精准控制停顿
B站的一款基于 XTTS 和 Tortoise 的 GPT 风格文本转语音(TTS)模型 IndexTTS 正式发布。 该系统在处理中文文本时,具备独特的拼音纠正汉字发音能力,并能够通过标点符号在任意位置精准控制停顿。 这一创新的技术使得文本转语音的效果更加自然流畅,受到了广泛关注。
2/27/2025 2:21:00 PM
AI在线
颠覆操作习惯!Raycast 推出 AI 神器:动动嘴就能操控电脑上的一切!
厌倦了在各种应用之间来回切换的繁琐操作?受够了被各种复杂指令和界面支配的“人机交互”? 效率神器 Raycast 再次放大招了!他们最新推出的 AI Extensions 功能,简直要彻底颠覆你与电脑的交互方式—— 现在,你只需动动嘴皮子,就能像指挥私人助理一样,操控电脑上的一切应用!想象一下,你无需打开日历 App,只需在 Raycast 中轻敲 @ai,然后说一句“下周三下午三点安排个会议”,会议就自动安排好了! 这种感觉就像科幻电影照进现实,你不再需要学习各种软件的复杂操作,只需用最自然的语言告诉电脑“你想做什么”,剩下的,就交给 Raycast 的 AI Extensions 吧!更令人叫绝的是,这一切都无需打开应用本身!
2/27/2025 2:16:00 PM
AI在线
我国牵头“机器人 + 养老”国际标准发布,应对全球老龄化
2月27日消息,据央视报道,近日国际电工委员会(IEC)正式发布由我国牵头制定的养老机器人国际标准(IEC63310《互联家庭环境下使用的主动辅助生活机器人性能准则》)。 该标准依据老年人生理、心理和行为特点,聚焦互联家居环境中老年人在日常生活、健康护理等方面的需求和特征,为养老机器人的产品设计、制造、测试和认证等提供基准。 世界卫生组织数据显示,预计2050年全球60岁以上人口数量将达21亿,其中80岁以上老年人有4.26亿。
2/27/2025 2:16:00 PM
AI在线
阿里启动2026届春招,开放3000岗位AI相关占近50%
阿里巴巴官方宣布正式启动了2026届春季实习生招聘,开放的岗位总数超过3000个,其中与人工智能(AI)相关的岗位占比近50%。 在某些业务部门,AI 岗位的比例更为显著,比如高德达到了约65%,而阿里云则超过了80%。 这一变化反映出阿里巴巴对 AI 技术的重视程度正在加大。
2/27/2025 2:13:00 PM
AI在线
Regie.ai:用AI增强销售能力,重视人性化的销售沟通
在现代商业环境中,销售团队需要各种资源来帮助他们成功达成交易。 然而,销售能力的提升并没有统一的标准。 有些团队在寻找潜在客户方面表现不佳,而另一些团队则需要支持来完成交易。
2/27/2025 2:01:00 PM
AI在线
亚马逊推出升级版Alexa+ 能读懂和总结长文档
在亚马逊年度设备与服务活动上,亚马逊正式推出了其增强版语音助手 Alexa 。 这一新版本不仅提升了语音交互体验,还融入了生成式人工智能技术,让用户与 Alexa 之间的互动更加智能和便捷。 在活动中,亚马逊演示了如何将文档分享给 Alexa ,使其能够提取关键信息并回答关于这些文档的问题。
2/27/2025 1:54:00 PM
AI在线
李开复:AI时代会让每个APP都比人更聪明
今日,零一万物CEO、创新工场董事长李开复在国联民生证券首届资本市场峰会上发表了主题演讲。 他在演讲中指出,2025年会是AI应用大规模落地的元年。 图源备注:图片由AI生成,图片授权服务商Midjourney相较云计算,预计AI2.0应用层的爆发周期将缩短到两年内。
2/27/2025 1:54:00 PM
AI在线
不要自回归!扩散模型作者创业,首个商业级扩散LLM来了,编程秒出结果
当前的 AI 领域,可以说 Transformer 与扩散模型是最热门的模型架构。 也因此,有不少研究团队都在尝试将这两种架构融合到一起,以两者之长探索新一代的模型范式,比如我们之前报道过的 LLaDA。 不过,之前这些成果都还只是研究探索,并未真正实现大规模应用。
2/27/2025 1:45:00 PM
机器之心
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
动辄百亿、千亿参数的大模型正在一路狂奔,但「小而美」的模型也在闪闪发光。 2024 年底,微软正式发布了 Phi-4—— 在同类产品中表现卓越的小型语言模型(SLM)。 仅用了 40% 合成数据,140 亿参数的 Phi-4 就在数学性能上击败了 GPT-4o。
2/27/2025 1:45:00 PM
机器之心
字节跳动AI智能助手豆包APP推出“照片动起来”功能
近日,字节跳动旗下的AI智能助手豆包APP宣布了一项创新功能——“照片动起来”。 这一功能的推出,旨在满足用户对于老照片动态化的需求,让那些曾经定格的瞬间重新焕发生机。 据悉,“照片动起来”功能操作简便,用户只需打开豆包APP,选择该功能并上传一张老照片,随后描述照片中人物或物体的动作。
2/27/2025 1:45:00 PM
AI在线
研究多模态?快来申报这个基金
2025 年 2 月 27 日,CCF 联合阿里妈妈正式发布 “CCF - 阿里妈妈科技袋基金” 第二期,共十个课题,聚焦多模态智能方向,申报截止时间:2025 年 3 月 26 日 24:00(北京时间),欢迎 CCF 会员积极申报。 2025 年 2 月 27 日,CCF 联合阿里妈妈正式发布「CCF - 阿里妈妈科技袋基金」第二期,聚焦在「多模态智能方向」展开研究,涵盖多模态推荐系统的递进式算法创新研究、基于多模态信息的用户意图识别、多模态中文广告海报制作、多模态视频创意制作等四个子方向,共十个课题。 申报截止时间:2025 年 3 月 26 日 24:00(北京时间),欢迎 CCF 会员积极申报。
2/27/2025 1:37:00 PM
机器之心
DeepSeek今日连开3源!针对优化的并行策略,梁文锋本人参与开发
按时整活! DeepSeek开源周第四天,直接痛快「1日3连发」,且全都围绕一个主题:优化并行策略。 DualPipe:一种创新的双向流水线并行算法,能够完全重叠前向和后向计算-通信阶段,并减少“流水线气泡”。
2/27/2025 1:10:00 PM
量子位
摆脱编码器依赖!Encoder-free 3D多模态大模型,性能超越13B现有SOTA | 上海AI Lab港中文等团队新作
无编码器多模态大模型被拓展到3D领域——3D编码器的功能被融入LLM本身,无编码器3D LMM适应不同的点云分辨率,摆脱预训练编码器的依赖。 来自上海AI Lab、西北工业大学、香港中文大学、清华大学等提出ENEL,在预训练阶段探索了如何使用自监督损失将3D编码器的功能整合到LLM本身,在指令调优阶段提出了一种层次几何聚合策略,基于PointLLM首次全面研究了无编码器架构在3D多模态大模型中的潜力。 在Objaverse基准测试中,ENEL表现突出,性能上超越目前SOTA ShapeLLM-13B。
2/27/2025 1:00:00 PM
量子位
超越Sora!阿里正式完全开源最新、最强大的视频生成模型 Wan2.1
阿里巴巴通义实验室正式开源了他们最新、最强大的视频生成模型 Wan2.1 系列! Wan2.1 亮点速览✨ 复杂运动: 视频动作更流畅自然,复杂场景也能轻松驾驭🧲 物理模拟: 物体交互更真实,视频更具沉浸感🎬 电影质感: 视觉效果更上一层楼,细节更丰富,更具艺术性✏️ 可控编辑: 编辑能力更强大,创作空间更广阔✍️ 视觉文字: 中英文动态文字生成,应用场景更丰富🎶 音效音乐: 视听体验一体化,视频极具感染力Wan2.1 系列模型家族,为不同需求的用户提供了多样化的选择:Wan2.1-I2V-14B: 图像到视频 (I2V) 领域的天花板! 140亿参数,720P高清画质,I2V 性能 SOTA!
2/27/2025 12:44:41 PM
AI寒武纪
榨干每一分算力:Distillation Scaling Laws带你走进高效模型新时代
初次阅读这篇文章,感到非常震撼。 在DeepSeek将知识蒸馏方法带入大众视野后,Apple与牛津大学的研究人员迅速提出了蒸馏缩放定律,并已于2月28日完成了所有实验及一篇长达67页的论文上传至arXiv。 这种效率和深度,无疑展示了大公司的研究实力。
2/27/2025 12:42:54 PM
Gloadma
外网夸爆DeepSeek开源周!今天一口气开源3个重磅!压轴戏期待拉满,R2、V4、被提名
出品 | 51CTO技术栈(微信号:blog51cto)好家伙! DeepSeek是真的OpenAI啊! 在第四天的开源日中,竟然一口气放出三个重磅的优化并行策略代码库,而且又是V3/R1模型中的干货:DualPipe:一种优化的双向流水线并行算法,旨在优化V3/R1模型训练中的计算和通信重叠。
2/27/2025 12:31:40 PM
CVPR 2025录用率22.1%,LeCun中奖!大模型参评,审稿人19篇论文被拒
刚刚,CVPR 2025录用结果出炉! 今年,共有13008份有效投稿并进入评审流程,其中2878篇被录用,最终录用率为22.1%。 近两年来,CVPR录用结果逐年递减。
2/27/2025 12:30:00 PM
新智元
Figure机器人进厂打工,8小时速成物流分拣大师!自研VLA模型全面升级
踹掉OpenAI之后,Figure的迭代堪称神速! 几天前才发布了第一款自研视觉-语言-动作(VLA)模型Helix,统一了感知、语言理解和学习控制。 就在刚刚,他们又在一个全新场景中实现了机器人应用的落地——物流包裹操作和分拣。
2/27/2025 12:12:28 PM
新智元