应用
OpenAI 升级 ChatGPT 语音模式,体验更自然对话
OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。 这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。 在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。
法国Mistral AI年销售额突破1亿美元,全球业务蓬勃发展
据《金融时报》报道,法国人工智能初创公司 Mistral AI 的年销售额已可能突破1亿美元。 自2025年初以来,该公司的收入实现了三倍增长,这一成果主要得益于欧洲及美国以外地区客户的强劲需求。 Mistral AI 的首席执行官阿图尔・孟什(Arthur Mensch)表示,近期公司签署了数亿美金的合同,进一步推动了其业务的扩展。
百度推出金融行业大模型,智能体成为AI竞争新焦点
在2025智能经济论坛上,百度集团的执行副总裁沈抖宣布,百度智能云推出了一款针对金融行业的全新大模型 —— 千帆慧金。 这一举措标志着百度在金融领域的深耕,意在为金融机构提供更为精准和高效的人工智能解决方案。 沈抖指出,目前已有65% 的央企选择与百度智能云合作,显示出市场对智能云技术的强烈需求。
马斯克曝光突破性合作:Grok 与 Neuralink 联手助渐冻症患者开口说话
马斯克今日在社交平台 X 上转发的一则案例视频,展示了 Neuralink 与 AI 助手 Grok 正在联合开发的一项突破性技术,帮助渐冻症患者“用意念发声”。 视频主角是渐冻症患者 Bradford Smith,他因疾病失去了行动和说话能力。 然而,通过 Neuralink 植入的脑机接口芯片,他得以用“想法”控制光标输入文字;随后,马斯克旗下的 AI 聊天机器人 Grok 会自动补全语句,再利用语音克隆技术,以患者原本的声音将这些文字“说出来”。
AI医疗大模型:投资热潮中的冷静思考
近年来,AI 医疗大模型成为医院数字化转型的新热点。 尽管各大医院纷纷推出针对心血管、病理和泌尿等领域的 AI 模型,但真正愿意投入资金的医院却不多,许多机构仍处于观望状态。 在市场上,包括上海中山医院、瑞金医院和仁济医院在内的头部三甲医院都已高调发布 AI 模型,然而,背后的资金来源却主要依赖地方政府的采购项目。
Runway AI 电影节在纽约盛大开幕,6000 部作品争夺十强荣誉
全球知名的 AI 视频技术公司 Runway 在纽约举行了其年度 AI 电影节。 此次电影节吸引了全球的目光,来自各地的创作者们纷纷提交了约6000部短片,最终评选出十部优秀作品进行展映。 Runway 的首席执行官克里斯托瓦尔・巴伦苏埃拉在活动中表示,三年前的愿景如今已成为现实,全球已有数百万人使用他们的工具创作出数十亿条视频。
欧洲AI黑马崛起:Mistral年营收或超1亿美元,拟融资10亿
法国人工智能初创公司 Mistral AI 正迅速崛起,正在成为欧洲科技舞台上一匹亮眼的“黑马”。 据《金融时报》最新报道,Mistral AI 的年销售额可能已突破1亿美元,其客户基础日益拓展,尤其在欧美以外市场表现强劲。 该公司首席执行官 Arthur Mensch 在接受采访时透露,自2025年初以来,公司收入已增长两倍,这一增长主要归功于国际客户的快速涌入。
iPhone神话动摇?苹果在AI竞赛中步履蹒跚,WWDC或成关键转折点
在全球生成式人工智能加速演进的背景下,苹果正面临一次“信任危机”。 尽管一年前高调预告将为 iPhone 带来一系列 AI 功能,尤其是 Siri 的智能升级,但截至目前,这些“Apple Intelligence”承诺大多尚未兑现。 而在谷歌、OpenAI、三星等竞争对手陆续发布 AI 手机与助手功能之际,苹果的沉默显得愈发被动。
小红书发布首个开源大模型dots.llm1:11.2 万亿非合成数据助力中文性能提升
小红书近日宣布开源其首个大规模模型 ——dots.llm1,该模型具有1420亿个参数,是一种专家混合模型(MoE)。 其设计的一个显著特点是,在推理过程中仅激活140亿参数,这种结构不仅保持了高性能,还大幅降低了训练和推理的成本。 dots.llm1使用了11.2万亿个非合成的高质量训练数据,这在当前开源大模型中显得非常罕见,表明小红书在语言处理方面的强大资源。
苹果研究揭示AI“假性思考”真相:推理模型在复杂任务下反而崩溃
一项由苹果研究人员主导的新研究,对当前被寄予厚望的大型推理模型(LRM)泼了一盆冷水。 研究发现,在解决复杂任务时,像 Claude3.7Thinking 和 Deepseek-R1等专为“模拟思维过程”设计的推理模型,不仅未能展现出优势,反而出现“思考不足”、性能崩溃等严重问题。 这项研究测试了四种经典逻辑谜题:汉诺塔、跳棋、渡河与积木世界。
英国多个组织呼吁监管机构限制 Meta 利用人工智能进行风险评估
互联网安全活动人士呼吁英国通信监管机构Ofcom限制AI在社交媒体风险评估中的使用,Meta计划自动化风险评估流程引发担忧。多个组织认为AI驱动的风险评估不符合《在线安全法案》要求。Meta回应称AI仅用于辅助工具,决策仍由人类监督。#AI安全# #社交媒体监管#
Neuralink 和 Grok 合作,脑机芯片为渐冻症患者赋予“发声”能力
视频内容显示,Neuralink 为一名渐冻症患者植入脑机接口芯片,使其可以通过意念移动光标输出文字,而后人工智能聊天机器人 Grok 会补全其语句,并创建一个精确的声音克隆,从而为患者发声。
英国呼吁限制 Meta 利用人工智能进行风险评估
近日,英国的互联网安全倡导者向国家通讯监管机构 Ofcom 发出警告,要求限制 Meta(前身为 Facebook)在关键风险评估中使用人工智能(AI)。 这一呼吁源于一份报告,报告指出 Meta 计划将高达90% 的风险评估工作交由 AI 自动完成。 这一改变引发了对用户安全,特别是未成年用户保护的广泛担忧。
长文本理解新王者?Gemini2.5Pro 击败 o3领跑 Fiction.Live 基准测试
在最近的 Fiction.Live 基准测试中,Gemini2.5Pro 在理解和再现复杂故事和背景方面表现出色,领先于竞争对手 OpenAI 的 o3模型。 这项测试远超传统的“大海捞针”式任务,专注于模型在海量上下文中处理深层语义和背景依赖信息的能力。 据测试数据显示,在上下文窗口长度达到192,000个词条(约14.4万个单词)时,o3模型性能急剧下滑,而 Gemini2.5Pro 的6月预览版(preview-06-05)在同一条件下依然保持了超过90% 的准确率。
Meta 拟投资超 100 亿美元,Scale AI 或迎来重大融资机会
根据彭博社的报道,Meta 正与 Scale AI 进行高达数十亿美元的投资谈判。 这笔交易的价值预计将超过100亿美元,将成为 Meta 在人工智能领域最大的一笔外部投资,也是私营公司历史上最大的融资事件之一。 Scale AI 是一家专注于数据标注服务的公司,帮助微软和 OpenAI 等企业训练其人工智能模型。
视频生成平台 Runway 举办年度 AI 电影节,6000 部参赛作品决出十强
不过,并非所有作品完全由 AI 生成。参赛门槛要求影片中必须使用 AI 视频技术,但并未规定比例,因此不少作品采用真人实拍与 AI 元素混合的方式呈现。
肝了30小时,Flux Kontext是我用过最稳、最能干活的AI图像模型!
大家好,我是言川。 继 Gemini、GPT-4o、豆包 AI 等图像模型陆续“用嘴改图”之后,又一款更猛的图像编辑模型来了——Flux Kontext,由 Flux 模型官方团队亲自操刀推出。 无论是角色 / 主体一致性、图像转绘、风格迁移、局部精修,还是图像内文字替换这些 AI 生图的老大难问题,它几乎全都解决了,先看我跑的案例:那么本篇文章,我就带大家把 Flux Kontext 的真实能力拆个底朝天。
即梦图片3.0叒重磅更新,这可能是对普通人最有用的一次!
即梦的最强 AI 绘图模型图片 3.0,又又又更新了。 内测上线了即梦图片 3.0 的,智能参考,现在,可以垫图了。 MD,这次连设计师的参考图也一键干碎了。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉