应用
实时口语聊天大模型 LLaMA-Omni 2 来了,能让你的 AI 聊天体验起飞!
最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。 这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量实时语音交互而生,在 Hugging Face 上一经发布,就引起了广泛关注。 语音交互发展历程回顾:从 “卡顿” 到 “丝滑”语音交互在人机交互领域的地位愈发重要,它就像是为我们打开了一扇便捷的大门,极大地提升了交互效率和用户体验。
月之暗面 Kimi 长思考模型 API 正式发布
月之暗面科技有限公司宣布正式发布其最新的长思考模型API——kimi-thinking-preview。 这一模型具备多模态推理能力和通用推理能力,擅长深度推理,能够帮助用户解决复杂的代码问题、数学难题和工作中的挑战。 kimi-thinking-preview模型是目前最新的k系列思考模型,用户可以通过简单的API调用轻松使用。
IBM 首席执行官进军人工智能市场并加大美国投资
在最近的一次采访中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,随着人工智能(AI)市场竞争的加剧,IBM 正计划通过提供能够整合客户使用的不同 AI 代理的工具,来提升其在该领域的销售。 这些工具将帮助客户管理他们在关键业务应用中的一系列 AI 代理,主要包括 Salesforce、Workday 和 Adobe 等公司的产品。 克里希纳指出,IBM 将助力客户构建适合未开发用例的 AI 代理,客户只需在五分钟内完成创建。
阿里通义Qwen3语言模型上线 ,开源实力再升级!
在全球人工智能领域,Qwen 系列大型语言模型迎来了新成员 ——Qwen3的发布。 今日,通义宣布将 Qwen3开源,带来了令人振奋的技术革新。 此次发布的旗舰模型 Qwen3-235B-A22B 以其2350亿个参数的规模在多个基准测试中展现出强大的竞争力,超越了 DeepSeek-R1、o1、o3-mini、Grok-3及 Gemini-2.5-Pro 等顶级模型。
Kimi 长思考模型 API 发布
kimi-thinking-preview 模型是月之暗面提供的具有多模态推理能力和通用推理能力的多模态思考模型,它擅长深度推理。
Recraft 完成 3000 万美元 B 轮融资,其图像生成模型曾击败 DALL-E 和 Midjourney
初创公司Recraft宣布完成3000万美元B轮融资,其图像生成模型“red_panda”在基准测试中超越DALL-E和Midjourney,成为行业焦点。该模型在品牌图像生成方面表现突出,精准放置品牌标识,无需额外编辑。#AI图像生成##Recraft融资#
深度监督网络作者谢赛宁被拒稿 11 年后翻盘获时间检验奖:拒稿≠学术死刑
谢赛宁十年前被 NeurIPS(当时还叫 NIPS)拒收的论文,刚在今年获得了 AISTATS 2025 年度时间检验奖。这篇论文就是《Deeply-Supervised Nets》(DSN,深度监督网络),2014 年 9 月挂上 arXiv。
超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶
超越 DeepSeek-R1 的英伟达开源新王 Llama-Nemotron,是怎么训练出来的?刚刚放出的论文,把一切细节毫无保留地全部揭秘了!
音乐界的sd?ACE-Step音乐生成模型发布,20秒打造4分钟完整歌曲
ACE-Step,一款由ACE Studio与StepFun联合开发的音乐生成“基础模型”,于近日正式亮相,被誉为“音乐界的Stable Diffusion”。 该模型以其惊人的生成速度和多样化功能引发行业热议,支持19种语言,可在短短20秒内生成一首长达4分钟的完整音乐作品,效率比主流模型快15倍以上。 核心功能亮点:从歌词到完整歌曲一气呵成ACE-Step以其强大的生成能力重新定义了AI音乐创作。
腾讯元宝上线「对话分组」:全平台同步 完全免费、不限次数
腾讯元宝宣布上线了一项新功能——「对话分组」。 这一功能的推出旨在帮助用户更好地管理和组织与元宝的聊天记录,使不同的对话能够根据项目、主题或任务进行分类,从而提升用户的使用体验。 「对话分组」功能允许用户为与元宝的聊天创建文件夹,就像在电脑上整理文件一样。
商汤科技携手中移动香港与香港中文大学法学院 开展视觉 AI 与大模型领域合作
近日,商汤科技在香港与中国移动香港有限公司及香港中文大学法学院签署了合作备忘录,正式启动在视觉人工智能(AI)与大模型技术等领域的深入合作。 这一合作旨在利用三方的优势,共同推动科技的创新与应用,助力香港及中国的科技发展。 商汤科技作为一家领先的人工智能企业,在视觉 AI 领域具有丰富的经验和技术积累。
Perplexity AI 推出全新 Comet 浏览器,挑战 Chrome 霸主地位
近日,Perplexity AI 宣布将在本月推出其新款 AI 驱动的 Comet 浏览器,标志着互联网浏览器市场的一场变革。 作为一种新兴的浏览器,Comet 旨在成为 Google Chrome 的有力竞争者,特别是在信息检索和用户体验方面。 图源备注:图片由AI生成,图片授权服务商MidjourneyComet 浏览器的构想早有端倪,近期用户发现 Perplexity 官网上新增了一个 “Learn Comet” 按钮,此外还曾短暂公开过一段宣传视频。
马斯克决定继续对 OpenAI 提起诉讼,关注焦点转向新计划
美国亿万富翁埃隆・马斯克近日表示,他将继续对 OpenAI 提起诉讼,尽管这家人工智能初创公司刚刚宣布放弃转变为营利性公司的计划。 这场法律争斗的背景相当复杂,而最近的动向更是为其增添了新的戏剧性。 马斯克是 OpenAI 的联合创始人之一,他对 OpenAI 的转变一直持有异议。
医疗自诊依赖 AI 聊天机器人存风险,专家呼吁谨慎使用
牛津大学研究发现,人们使用聊天机器人获取健康建议时,往往难以提供关键信息,导致建议质量不佳。研究显示,聊天机器人不仅增加识别健康问题的难度,还可能低估问题严重性。#AI医疗##健康科技#
大BUG!非学生用户竟能白嫖谷歌顶级AI全家桶 白嫖攻略速看
谷歌旗下高端AI服务Gemini Advanced的订阅系统惊现黄金漏洞。 此刻,任何用户只需点击鼠标,就能解锁原本价值300美元/年的学生特权套餐,享受包括百万级文本处理、智能学术助手、2TB云存储在内的全套AI黑科技,有效期直通2026年夏天!免费特权内容包括什么?获取Gemini Advanced学生套餐后,您将享有以下高级功能:扩展的上下文理解能力NotebookLM Plus服务2TB云存储空间最新版本的Gemini模型使用权如何获取?获取过程非常简单:使用美国IP地址访问 "获取学生优惠"按钮按照页面提示完成操作即可激活服务重要注意事项这项优惠看似很诱人,但有几点必须注意:免费使用期限截止至2026年6月30日需要在2025年8月底之前完成学生身份验证此优惠仅在美国地区提供仅适用于年满18周岁且已通过验证的学生需要提供有效的支付方式信息潜在风险根据目前情况分析,这可能是系统暂时性漏洞。 如果您不是符合条件的学生:账号可能面临后期被取消优惠的风险系统修复后可能需要支付费用已经付费订阅的用户无法通过此方式获取此优惠这一特殊情况提供了接触Google高级AI服务的机会,但请谨慎使用,并注意可能的后续验证要求。
马斯克决定继续起诉 OpenAI,争议仍未平息
近日,美国亿万富翁埃隆・马斯克的律师马克・托洛夫在一场新闻发布会上宣布,马斯克将继续对人工智能公司 OpenAI 提起诉讼。 这一消息引起了业界的广泛关注,尤其是在 OpenAI 之前宣布放弃转变为营利性公司的计划后,矛盾似乎愈演愈烈。 马斯克是 OpenAI 的联合创始人之一,早在不久前,他就曾提起诉讼,试图阻止 OpenAI 从非营利组织转变为营利性公司。
联合国开发署:AI 成全球发展新曙光,中国领跑 AI 赛道
联合国开发计划署今天(5 月 6 日)发布《2025 年人类发展报告 —— 抉择时刻:人工智能时代的人类与可能性》报告,指出人类发展进程正经历前所未有的放缓,而人工智能有望为发展注入新动能。
Claude 移动应用即将推出语音模式,支持多种声音选项
Anthropic 的 Claude 移动应用即将迎来一次重要升级,新增的语音模式功能备受期待。 据 TestingCatalog 周日的报道,Claude 的语音模式将采用推按式对话方式,并且支持多种声音选项。 在语音模式下,Claude 不仅可以进行语音对话,还具备了网页搜索的能力。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉