应用
火山引擎发布豆包1.5深度思考模型:结合视觉理解与智能项目管理
在近日举行的火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待正式公布了豆包1.5深度思考模型,标志着这一创新技术将正式面向企业提供服务。 豆包1.5不仅在基础功能上进行了升级,还引入了更多智能化的应用场景,助力企业实现更高效的数字化转型。 谭待在发布会上表示,豆包1.5深度思考模型能够结合视觉理解,提供更多创新功能。
OpenAI 新系统阻断生物和化学风险信息,保障 AI 安全
OpenAI 近期推出了一项新系统,旨在监控其最新的 AI 推理模型 o3和 o4-mini,以阻止与生物和化学威胁相关的提示。 该系统的目标是防止模型提供可能教唆他人实施有害攻击的建议,确保 AI 的安全性。 OpenAI 表示,o3和 o4-mini 在能力上较之前的模型有显著提升,因此在恶意用户手中可能带来新的风险。
DroidRun正式开源,LLM驱动Android手机自动化控制新突破
近日,一个名为DroidRun的开源项目引发了广泛关注。 该项目通过大型语言模型(LLM)实现自然语言指令控制Android手机,为用户提供了前所未有的自动化体验。 从社交媒体管理到日常任务自动化,DroidRun展示了AI在移动设备交互领域的巨大潜力。
AI音乐时代来临:Deezer平台上18%的新曲由人工智能创作
据法国流媒体平台 Deezer 最新公布的数据,约18% 的上传歌曲完全由人工智能生成,这一比例显示出 AI 在音乐创作领域的广泛应用与日俱增。 数据显示,每天有超过20,000首 AI 生成的曲目被上传到该平台,几乎是四个月前的两倍。 Deezer 的创新负责人 Aurelien Herault 指出,AI 生成内容的数量持续涌入流媒体平台,而且没有减缓的迹象。
DeepSeek创始人梁文锋荣登《时代》“2025年全球最具影响力100人”榜单
近日,DeepSeek创始人梁文锋入选《时代》杂志“2025年全球最具影响力100人”榜单,成为全球科技与金融领域的领军人物之一。 与此同时,梁文锋还凭借330亿元人民币的财富首次登上了2025年3月27日发布的《胡润全球富豪榜》,进一步巩固了他在全球商业界的影响力。 梁文锋的成功之路始于2008年,当时他开始带领团队利用机器学习等前沿技术,探索全自动量化交易。
字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型
字节跳动发布豆包1.5深度思考模型,采用MoE架构,总参数200B,激活参数20B,推理成本低于业界50%。新模型在数学、编程、科学推理及创意写作等任务中表现突出,还能结合视觉理解技术提供更多功能。#AI大模型##字节跳动#
可灵AI全球发布2.0模型,史上最强视觉模型来了!网友:人人都能手搓科幻片
这次,可灵 AI 又出尽了风头。 4 月 15 日,可灵 AI 开了场发布会,高调推出最新升级的两款基础模型 —— 可灵 2.0 视频生成模型和可图 2.0 图像生成模型。 新模型效果好到什么程度?
Anthropic即将推出Claude AI语音助手,挑战ChatGPT
据彭博社报道,人工智能公司 Anthropic 正在积极开发其聊天机器人 Claude 的新功能 —— 语音助手,预计本月内将正式发布。 这一新功能将使 Claude AI 与 OpenAI 的 ChatGPT 在交互体验上展开竞争,丰富用户与 AI 的交流方式。 距离 OpenAI 推出类似功能已近一年,Claude 的语音模式显然是对这一市场需求的及时回应。
微信首个AI助手 “元宝” 正式上线,可以添加为微信好友
微信平台推出了首个 AI 助手 ——“元宝”。 用户只需在微信中搜索 “元宝”,添加为好友后,即可轻松与其进行对话。 与传统的聊天机器人不同,元宝以好友的身份出现,无需下载其他应用或小程序,聊天时甚至会显示 “对方正在输入...” 的信息,带来更加真实的互动体验。
微信上线元宝AI好友功能,强化超级应用生态对竞争对手形成新挑战
微信于2025年4月16日正式推出元宝AI好友功能,允许用户将腾讯自研的AI助手元宝添加为微信联系人,直接在聊天窗口进行交互。 这一功能的发布不仅增强了微信作为超级应用的粘性,也对其他AI聊天服务和小程序构成显著竞争压力。 以下是AIbase对元宝AI好友功能的深度解析,探讨其技术亮点、用户体验及对行业的潜在影响。
OpenAI 发布全新人工智能模型,实现 “图像思考” 能力
OpenAI 最近推出了其最新的人工智能模型,名为 o3。 这款模型标志着 AI 在理解和分析图像方面的一次重大进步,尤其是在处理低质量草图和图表方面。 与此同时,OpenAI 还发布了一个较小的版本 o4-mini,进一步丰富了其产品线。
OpenAI 拟以 30 亿美元收购 AI 编程工具 Windsurf
彭博社率先报道,OpenAI 正与人工智能辅助编程工具 Windsurf(前身为 Codeium)展开收购谈判,交易金额约为30亿美元。 这一潜在收购将成为 OpenAI 迄今为止最大规模的并购交易,标志着其在 AI 驱动的开发者工具市场迈出重要一步。 Windsurf:AI 编程领域的明星工具Windsurf 是一款广受开发者欢迎的 AI 编程助手,能够基于自然语言提示生成代码、解释现有代码并执行相关任务。
月之暗面Kimi开源数学定理证明模型Kimina-Prover
Kimi 技术团队近日发布了 Kimina-Prover 预览版的技术报告,并开源了1.5B 和7B 参数的模型蒸馏版本、用于数据生成的 Kimina-Autoformalizer-7B 模型以及修订过的 miniF2F 基准测试数据集。 Kimina-Prover 是由 Numina 和 Kimi 团队联合研发的一款数学定理证明模型,它在形式化定理证明领域采用了一种新颖的、由推理驱动的探索范式,展现出极佳的性能。 Kimina-Prover 基于 Qwen2.5-72B 模型,并结合 Kimi k1.5的大规模强化学习(RL)流程进行训练。
义乌商城集团接入阿里通义大模型 将打造“AI智能经营助手”
义乌商城集团宣布正式接入阿里通义大模型,结合阿里巴巴在云计算、大数据和电商等领域的优势,帮助210万中小商家利用 AI 技术实现精准经营并快速拓展海外市场。 此次合作标志着义乌商城集团在数字化转型和全球化布局方面迈出了重要一步,也展现了阿里巴巴在推动中小企业数字化转型中的重要作用。 义乌商城集团旗下的 Chinagoods 平台覆盖超过1200万种产品,服务7.5万家实体商铺及210万家中小微企业。
Adobe 投资英国AI视频公司 Synthesia
近日,英国初创公司 Synthesia 凭借在企业 AI 生成视频领域的杰出表现,成功获得了 Adobe 的战略投资。 自成立以来,Synthesia 在 AI 视频化身技术上不断创新,目前已成为行业的领军者。 据悉,Synthesia 的年度经常性收入已突破1亿美元,成为众多企业视频解决方案的首选。
OpenAI 推出全新推理模型 o3,实现图像思考能力
OpenAI 近期发布了其最新的推理模型 o3和 o4-mini,标志着人工智能领域的一次重大突破。 这两款模型不仅在推理能力上超越了以往的版本,还首次实现了图像思考的能力,能够将视觉信息直接融入到思维过程中。 o3被誉为 “天才级” 模型,尤其在编程和数学等任务中表现出色,准确率高达87.5%。
OpenAI开源超Agent:Codex CLI,五小时内破 5000 颗星
OpenAI 正式发布了其最新开源项目 Codex CLI,这是一款轻量级的代码智能体工具。 该工具的发布迅速引起了极大的关注,仅在短短5小时内,Codex CLI 便突破了5000颗星的评价,预计今天有望突破1万颗星,迅速成为 Github 上的一颗新星。 OpenAI 的联合创始人兼总裁 Greg Brockman 表示,Codex CLI 只是他们代码工具系列的第一款,未来将继续推出更多的智能体产品。
上海人工智能实验室开源小语种多模态数据集万卷·丝路2.0
由上海人工智能实验室发布的“万卷·丝路2.0”多语言多模态语料库正式开源。 该语料库在原有的阿拉伯语、俄语、韩语、越南语、泰语等5个语种基础上,新增了塞尔维亚语、匈牙利语、捷克语3个稀缺语料数据,涵盖文本、图片、音频、视频四大模态,数据总量超过1150万条,音视频时长超过2.6万小时,成为小语种多模态领域的重要资源。 “万卷·丝路2.0”具有多语言、大规模、多模态、高质量的特点。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉