应用
苹果研究破解 AI“英语口音”难题,提升多语言自然性
为了缩小差距,研究人员通过“ 回译法”自动生成训练样本,将人工撰写的流畅中文内容先翻译成英文,再逆向翻译成带有 "翻译腔" 的“反面”样本。利用这类对比数据训练模型加强自然表达能力,在保持基准性能的前提下显著改善语言输出质量。
5/17/2025 6:42:15 AM
问舟
最强 AI 编程助手:OpenAI 发布 Codex 智能体,专注自动化软件开发
OpenAI推出基于云端的AI智能体Codex,专注于自动化软件开发,涵盖修复错误和实现功能等任务。目前以研究预览形式在ChatGPT平台上线,Pro、Enterprise和Team用户可率先体验。#AI编程# #OpenAI#
5/17/2025 6:34:41 AM
故渊
FBI 警告“AI 骗局”升级:不法分子会假扮美国高官的声音行骗
从上个月开始,诈骗者通过短信和 AI 语音信息伪装成美国高级官员,试图通过与目标建立联系,从而获得个人账户的访问权限。
5/16/2025 9:31:54 PM
清源
武汉大学校长张平文:AI 不存在“过度使用”的问题,武大不会缩减文科
在昨日的2025世界数字教育大会上,武汉大学校长张平文表示,人工智能是工具而非“洪水猛兽”,并不存在“过度使用”的问题,关键在于教师和教育模式需要适应新技术的出现。
5/16/2025 5:25:52 PM
清源
腾讯混元图像 2.0 模型发布:毫秒级响应,一边打字一边出图
在同类商业产品每张图推理速度需要 5 到 10 秒的情况下,腾讯混元号称可实现毫秒级响应,支持用户可以一边打字或者一边说话一边出图,改变了传统“抽卡 — 等待 — 抽卡”的方式。
5/16/2025 5:21:14 PM
汪淼
苹果CarPlay Ultra发布!全屏接管汽车仪表盘,ChatGPT加持,开启智能驾驶新时代
苹果正式推出其新一代车载系统CarPlay Ultra,以深度整合iPhone与汽车所有显示屏为核心,首次将ChatGPT融入驾驶体验。 这款系统不仅覆盖中央触摸屏,还全面接管数字仪表盘,提供统一的苹果设计语言和前所未有的驾驶交互。 AIbase综合最新信息,深入解析CarPlay Ultra的技术突破及其对智能驾驶的深远影响。
5/16/2025 5:00:55 PM
AI在线
大语言模型也有“健忘症”?Supermemory推出“无限记忆外挂”,让你的AI永不失忆!
在与ChatGPT或Claude等大语言模型长时间对话时,你是否也遇到过对话内容突然"失忆"的尴尬场景?这并非AI有意为之,而是受限于大语言模型固有的上下文窗口限制。 无论是8k、32k还是128k tokens的容量,一旦超过这个阈值,先前的对话内容就会被截断丢失,导致交互体验严重受损。 近日,一家名为Supermemory的公司推出了一项颠覆性技术——Infinite Chat API,号称能无限扩展任何大语言模型的上下文长度,让AI拥有"长期记忆"能力,且无需开发者重写任何应用逻辑。
5/16/2025 4:00:55 PM
AI在线
Perplexity 推出 Comet 浏览器 beta 版,重新定义网络浏览体验
近期,Perplexity 宣布推出其代理智能浏览器 Comet 的 beta 版,目前仅限于部分 Apple Silicon Mac 用户进行测试。 早期用户本周已收到邀请,Perplexity 鼓励他们反馈使用过程中的 Bug 和功能建议,以推动产品的发展。 Comet 浏览器旨在通过上下文感知智能来重新构想网络浏览体验。
5/16/2025 4:00:55 PM
AI在线
复旦携手腾讯推出说话人视频生成工具DICE-Talk,备情感表达
由复旦大学与腾讯联合研发的DICE-Talk说话人视频生成工具于近日正式发布,以其卓越的情感表达能力和逼真的人物表现引发行业热议。 AIbase通过整合社交媒体最新动态及公开信息,为您深度解析这一技术突破的亮点与潜力。 DICE-Talk的核心创新在于其身份-情感分离处理机制。
5/16/2025 3:00:55 PM
AI在线
MiniMax Speech-02碾压OpenAI与ElevenLabs,登顶全球TTS榜首
MiniMax Audio推出的Speech-02系列语音模型席卷全球,强势登顶Artificial Analysis Speech Arena和Hugging Face TTS Arena两大权威榜单,力压ElevenLabs、OpenAI等国际顶尖竞争对手。 这款模型以超高语音逼真度和多语言支持惊艳业界,成为AI语音技术的全新标杆。 AIbase综合最新动态,深入解析Speech-02的技术亮点及其对行业的深远影响。
5/16/2025 3:00:55 PM
AI在线
Sam Altman 展望未来:让ChatGPT记住你的一切生活点滴
在近日的一场人工智能活动上,OpenAI 首席执行官 Sam Altman 分享了关于 ChatGPT 未来发展的激动人心的愿景。 他提到,理想中的 ChatGPT 将能够记录用户生活中的每一个瞬间,从而提供更个性化的服务。 当被问及如何让 ChatGPT 更加贴近用户时,Altman 表示希望开发出一个小型推理模型,能够整合人们的生活经历与背景信息。
5/16/2025 3:00:55 PM
AI在线
腾讯混元图像 2.0 发布:实时生图毫秒级速度与超写实画质
腾讯正式发布其最新的混元图像2.0模型(Hunyuan Image2.0),标志着 AI 图像生成技术迈入 “毫秒级” 响应时代。 新模型在速度上有了显著提升,相比于前代产品,混元图像2.0的参数量提高了一个数量级,结合了高效的图像编解码器和全新的扩散架构,能够在同类商业产品通常需要5到10秒的推理速度下,实现毫秒级的快速响应。 用户在生成图像时,可以一边输入文本或进行语音指令,一边获得实时图像输出,极大地改变了传统的 “抽卡 - 等待 - 抽卡” 模式,提升了用户的交互体验。
5/16/2025 2:00:55 PM
AI在线
xAI公开Grok系统提示,回应争议性修改事件
埃隆・马斯克创办的人工智能初创公司 xAI 近期因其聊天机器人 Grok 在南非 “白人种族灭绝” 话题上产生争议性回应而备受关注。 对此,xAI 正在努力解决此问题,并表示已接到指示采取行动。 根据报道,Grok 的一些回应不仅与该话题相关,还在回复不相关查询时主动提及,导致用户的不满和强烈反对。
5/16/2025 2:00:55 PM
AI在线
美国宣布与阿联酋合作打造海外最大 AI 数据中心,可支持 250 万枚英伟达 B200 芯片
研究机构兰德公司分析师伦纳特・海姆(Lennart Heim)表示,该数据中心的规模比迄今为止能看到的所有其他主要人工智能基础设施都要大,足以支持 250 万枚英伟达 B200 芯片。
5/16/2025 1:46:40 PM
问舟
退钱:美国教授用 ChatGPT 做讲义漏洞百出,学生讨还 8000 美元学费
美国东北大学今年的毕业生埃拉・斯特普尔顿(Ella Stapleton)在发现其教授利用 ChatGPT 辅助制作讲义后大为震惊,随即向学校提出正式投诉,并要求退还该课程的全部学费。
5/16/2025 1:18:56 PM
小小
微软纳德拉应对 AI 新挑战,DeepSeek 崛起引发战略调整
R1的处理成本仅为OpenAI的3.6%,且开源免费,威胁微软对OpenAI的巨额投资。纳德拉迅速组织团队评估并应对,最终选择拥抱竞争,将R1整合进微软云服务Azure。这一事件揭示了纳德拉对AI商品化的独特思考,以及微软在AI战略上的灵活调整。
5/16/2025 12:18:23 PM
故渊
针对开发人员!OpenAI官宣明天开启新的发布直播
OpenAI宣布明天美国西部时间早上8点将开启新的发布直播,并称请开发人员(以及那些想成为开发人员的人)的人收看。
5/16/2025 12:00:55 PM
AI在线
Firecrawl模板发布!点几下将任意网站变LLM就绪数据,AI开发提速10倍!
Firecrawl宣布正式发布模板(Templates),一套集成了游乐场设置、代码片段和完整存储库的开源工具包,旨在帮助开发者以最简单的方式将任意网站转化为大语言模型(LLM)就绪数据。 这一创新极大降低了AI数据抓取的技术门槛,为构建AI驱动的应用程序注入了新动能。 AIbase深入解析Firecrawl模板的核心功能及其对AI生态的影响,带您一探这一抓取神器的魅力。
5/16/2025 12:00:55 PM
AI在线
资讯热榜
Meta视觉基座DINOv3王者归来:自监督首次全面超越弱监督,商用开源
Meta刚刚开源DINOv3,横扫60+任务,无标注封神!
扎克伯格看OpenAI直播挖人,北大校友孙之清加入Meta
ChatGPT或将引入广告!OpenAI高管首度松口,用户破7亿仍难盈利
Nvidia 投资 5 亿美元,Cohere 公司估值达 68 亿美元
破天荒!OpenAI、Cursor多位开发大牛联手曝出GPT5提示词指南!晒官方系统提示词优化秘籍,最大化编程性能,工作流更可控
OpenAI华人露头就被小扎挖!95后北大校友1个月前上直播,今天已是Meta人
2025年AI工具大盘点!这6款神器让你的效率提升3倍!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
英伟达
Anthropic
代码
训练
算法
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
AI新词
生成式
Claude
苹果
Agent
神经网络
AI for Science
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
GPU
AI设计
百度
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
场景
大型语言模型
深度学习
预测
伟达
视觉
Transformer
AGI
视频生成
架构
神器推荐
亚马逊
Copilot
DeepMind
应用
安全