AI在线 AI在线

AI新词

Mistral AI 发布新版文档识别技术 Mistral OCR 3 模型

Mistral AI 发布新版文档识别技术 Mistral OCR 3 模型

Mistral AI 最近发布了其最新版本的文档识别技术 ——Mistral OCR3,标志着文档处理领域的重大进步。 该技术在处理各类文档时展现了卓越的准确性和高效性,特别是在表格、扫描文档、复杂表格以及手写识别方面,相较于其前一版本 Mistral OCR2,整体表现提升了74%。 Mistral OCR3的设计宗旨在于从多种类型的文档中提取文本和嵌入式图像,以实现极高的准确度和出色的性能。
12/19/2025 6:16:43 PM AI在线
罗永浩宣布 2025 科技创新大会将发布细红线 AI 软件

罗永浩宣布 2025 科技创新大会将发布细红线 AI 软件

罗永浩近日在微博上透露,2025 年度科技创新分享大会的门票将于 12 月 22 日中午 12:00 在大麦 App 上正式发售。 此次活动定于 12 月 30 日在上海市徐汇区的西岸国际会展中心举行。 罗永浩强调,本次售票将采用实名制,购买的门票不得转让。
12/19/2025 4:51:47 PM AI在线
​微信元宝 AI 助手增加新功能,轻松一句话设置提醒

​微信元宝 AI 助手增加新功能,轻松一句话设置提醒

近日,微信的元宝 AI 助手宣布了新功能,用户现在可以通过一句话在微信中设置提醒。 只需向元宝发送包含事项及时间的消息,元宝就能自动识别任务内容,并在指定时间通过微信服务通知提醒用户。 这一功能的推出,让设置提醒变得如同与朋友聊天一样简单。
12/19/2025 4:51:40 PM AI在线
豆包上线 Seedance 1.5 Pro,可直接生成有声视频

豆包上线 Seedance 1.5 Pro,可直接生成有声视频

字节跳动新一代音视频创作模型 “Seedance1.5Pro” 正式登陆豆包,为普通用户打开了 “零门槛做有声视频” 的新体验。 这次上线的 Seedance1.5Pro,核心是把 “文字 - 画面 - 声音” 的创作链路做了一体化升级:语义 音画同步:不再是先出画面再配声音,模型能深度理解文本意图,同步生成匹配内容的画面与音效、台词,避免 “音画脱节”;更自然的 “开口说话”:生成的人物台词不再是机械合成音,语气、节奏更贴近真人表达;电影感叙事 动态镜头:画面会自带景别切换、运镜效果,复杂动作(比如人物的肢体互动)也能被精准捕捉,不用再手动调特效。 普通用户的操作也很简单:打开豆包 App 对话框,点击 “照片动起来” 功能,选择 “1.5Pro” 模型,上传一张参考图(比如自己的生活照、手绘草稿),再输入提示词(比如 “让这只猫用温柔的语气讲睡前故事,背景是星空卧室”),就能直接生成一条完整的有声视频。
12/19/2025 4:51:40 PM AI在线
火狐浏览器祭出 AI“终极开关”:允许用户一键彻底关停所有 AI 功能

火狐浏览器祭出 AI“终极开关”:允许用户一键彻底关停所有 AI 功能

在 Mozilla 新任 CEO 宣布将 Firefox 打造为“现代 AI 浏览器”后,由于担心隐私泄露和浏览器臃肿,大量忠实用户表达了强烈不满。 针对社区的质疑,Firefox 开发者 Jake Archibald 近期公开回应,明确表示 Firefox 将推出一个名为“终止开关(Kill Switch)”的功能,旨在通过赋予用户绝对的控制权来重新赢回信任。 据 AIbase 报道,这个“终止开关”并非简单的隐藏选项,而是一个全局性的设置。
12/19/2025 3:17:35 PM AI在线
LeCun再创业!新公司估值247亿,CEO却不是他!

LeCun再创业!新公司估值247亿,CEO却不是他!

在人工智能领域,知名科学家 Yann LeCun 即将开设新公司,这一消息引起了广泛关注。 名为 Advanced Machine Intelligence Labs(AMI Labs)的新公司,计划于明年1月正式成立,目标是估值30亿欧元(约247亿人民币)。 LeCun 在 Meta 的最后日子里,带着对 “世界模型” 的热情,决定走上开源之路,并与老东家 Meta 保持合作。
12/19/2025 3:17:35 PM AI在线
微软联手 Kimi 打造 Office 自动化 Agent,AI 云巨头开启本土化“自我修正”

微软联手 Kimi 打造 Office 自动化 Agent,AI 云巨头开启本土化“自我修正”

继本月初微软 Azure 宣布接入月之暗面(Moonshot AI)的 Kimi k2 模型后,双方合作正迅速向应用层渗透。 据科创板日报披露,微软计划于本月上线全新的 Agent 功能。 该功能将深度利用 Kimi 的长程推理与工具调用能力,实现 Office 产品的全面自动化。
12/19/2025 3:17:35 PM AI在线
防范未成年人风险:OpenAI与Anthropic将推出AI年龄预测功能

防范未成年人风险:OpenAI与Anthropic将推出AI年龄预测功能

随着全球对青少年网络安全的关注度日益提高,两大人工智能巨头OpenAI和Anthropic于本周四宣布,将采取更积极的措施来识别和保护未成年用户。 这两家公司正计划通过 AI 模型预测用户年龄,并针对青少年群体更新产品指南。 OpenAI:安全高于一切,更新青少年互动准则OpenAI在其最新发布的“模型规范”中新增了四项针对18岁以下用户的核心原则。
12/19/2025 2:01:45 PM AI在线
美团推出 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar

美团推出 SOTA 级虚拟人视频生成模型 LongCat-Video-Avatar

近日,美团旗下的 LongCat 团队宣布开源其最新的视频生成模型 ——LongCat-Video-Avatar,标志着虚拟人技术的又一次重要突破。 该模型在长视频生成领域表现优异,具有多项核心功能,吸引了广泛的开发者关注。 LongCat-Video-Avatar 基于此前的 LongCat-Video 模型,延续了 “一个模型支持多任务” 的设计理念,原生支持音频文本转视频(AT2V)、音频文本图像转视频(ATI2V)及视频续写等功能。
12/19/2025 12:16:17 PM AI在线
OpenAI 强化未成年人保护机制:ChatGPT 推出全新安全规范

OpenAI 强化未成年人保护机制:ChatGPT 推出全新安全规范

OpenAI 近日对 ChatGPT 进行了重要更新,正式引入面向 18 岁以下用户的全新安全规范。此次更新通过四项核心原则,进一步强化对青少年心理健康与使用安全的保护,强调安全优先、积极引导线下社交以及以尊重和关怀的方式进行互动。OpenAI 表示,这一举措既是对未成年人使用 AI 风险的主动回应,也体现了其在用户安全与社会责任方面的持续投入
12/19/2025 10:31:24 AM AI在线
瑞典初创公司 Lovable 融资 3.3 亿美元,估值飙升至 66 亿美元

瑞典初创公司 Lovable 融资 3.3 亿美元,估值飙升至 66 亿美元

瑞典的初创公司 Lovable 在短短五个月内,估值已超过之前的三倍。 近日,位于斯德哥尔摩的 Lovable 宣布成功完成了一轮3.3亿美元的 B 轮融资,此次融资由 CapitalG 和 Menlo Ventures 领投,公司的估值达到了66亿美元。 此次融资还得到了 Khosla Ventures、Salesforce Ventures 和 Databricks Ventures 等多家投资机构的参与。
12/19/2025 10:31:16 AM AI在线
ChatGPT 移动应用全球用户支出突破 30 亿美元

ChatGPT 移动应用全球用户支出突破 30 亿美元

根据应用数据分析公司 Appfigures 的最新统计,自2023年5月上线以来,ChatGPT 移动应用的全球用户支出已成功突破30亿美元,创下新的行业里程碑。 此数据涵盖了该应用在苹果 iOS 和安卓系统平台上的累计支出,值得注意的是,ChatGPT 最初是仅在 iOS 平台上发布的。 图源备注:图片由AI生成,图片授权服务商Midjourney2023年是 ChatGPT 应用的首个运营年,用户支出达到了4290万美元。
12/19/2025 10:31:04 AM AI在线
英国演员投票拒绝数字扫描,反对 AI 技术滥用

英国演员投票拒绝数字扫描,反对 AI 技术滥用

近日,英国表演艺术工会 “公平” 发起了一项投票,要求演员拒绝在拍摄现场进行数字扫描,以保护他们的肖像不被人工智能滥用。 此次投票结果显示,98% 的参与者支持这一决定,显示出演员们对人工智能技术在艺术领域应用的强烈反对。 工会总秘书保罗・弗莱明表示:“人工智能是一个具有划时代意义的挑战。
12/19/2025 10:30:58 AM AI在线
OpenAI发布GPT-5.2-Codex:最强智能体编程模型登场,可自主完成漏洞挖掘与PR提交

OpenAI发布GPT-5.2-Codex:最强智能体编程模型登场,可自主完成漏洞挖掘与PR提交

OpenAI今日正式推出其迄今最先进的智能体编程模型——GPT-5.2-Codex,标志着AI在软件工程领域的实战能力迈入新纪元。 该模型专为解决复杂、长周期的现实世界编码任务而设计,不仅在权威基准测试中刷新纪录,更首次实现从代码理解、环境搭建到漏洞挖掘、Pull Request提交的全流程自主操作。 GPT-5.2-Codex并非简单迭代,而是深度融合了GPT-5.2的通用推理能力与GPT-5.1-Codex-Max的终端操作技能,并引入革命性的 “上下文压缩”技术——使其在处理代码重构、跨库迁移等依赖超长上下文的任务时,效率与准确性大幅提升。
12/19/2025 10:30:58 AM AI在线
苹果发布全新多模态 AI 模型 UniGen 1.5,实现图像理解、生成与编辑三合一

苹果发布全新多模态 AI 模型 UniGen 1.5,实现图像理解、生成与编辑三合一

近日,苹果研究团队推出了最新的多模态 AI 模型 UniGen1.5,标志着图像处理技术的一次重要突破。 该模型不仅能够理解图像,还能生成和编辑图像,这三大功能被成功整合在一个系统中,显著提升了工作效率。 与传统方法不同,UniGen1.5采用了统一框架,能够同时完成图像理解、生成和编辑。
12/19/2025 10:30:57 AM AI在线
告别信息淹没!ChatGPT 推出聊天置顶功能,让重要对话触手可及

告别信息淹没!ChatGPT 推出聊天置顶功能,让重要对话触手可及

在数字时代,信息泛滥已经成为常态。 许多人在使用聊天工具时,常常面临一个共同的问题:重要对话在无尽的新消息中淹没,难以找到。 为了改善这一低效体验,OpenAI 于 12 月 19 日正式推出了 ChatGPT 的 “聊天置顶”(Pinned Chats)功能。
12/19/2025 10:30:57 AM AI在线
火山引擎总裁谭待:大模型市场未来将迎十倍增长

火山引擎总裁谭待:大模型市场未来将迎十倍增长

在 FORCE 原动力大会上,火山引擎总裁谭待在接受媒体采访时,对公司旗下豆包大模型的表现做出了积极评价。 他指出,尽管在国内市场上,豆包大模型的成绩相对明显,但在全球范围内,如 OpenAI 和 Gemini 等竞争对手的表现同样突出。 因此,火山引擎在这一领域还有很多努力的空间,尤其是在全球市场的拓展上,谭待提到公司旗下的 Seedance 和 Seedream 在国际市场上的表现也不错。
12/18/2025 6:01:19 PM AI在线
Google Labs 放大招!AI 助理 CC 正式亮相:每天早上自动发邮件,帮你把 Gmail、Calendar、Drive 全盘打理好!

Google Labs 放大招!AI 助理 CC 正式亮相:每天早上自动发邮件,帮你把 Gmail、Calendar、Drive 全盘打理好!

Google Labs 今日低调推出了一款代号为“CC”的全新 AI 邮件助理(实验性功能),它不是简单的 Gmail 智能回复,而是真正能在 Gmail、日历(Calendar)和云端硬盘(Drive)之间自由穿梭的“全能生活助理”。 每天早上自动为你写一封“人生提醒信”  CC 最吸睛的特性是:每天早晨,你打开 Gmail 收件箱,就能看到一封来自 CC 的个性化早间邮件,内容堪称“懂你到骨子里”:- 今天上午10点有一个重要会议  - 下午需要回复某位客户的邮件  - Drive 里的项目报告还差你的签字  - 昨天那封没回的邮件我已经整理好,随时回复……一封邮件搞定全天待办,再也不用打开十几个标签页、翻遍备忘录、来回切换 App。 核心能力:跨应用深度理解与主动提醒  - 自动梳理待办:实时扫描日历事件、未读邮件、Drive 文件修改记录,精准提炼出“今天最重要的事”。
12/18/2025 6:01:14 PM AI在线