资讯列表
Google AI Studio 现可通过 ai.dev 域名直接访问
谷歌今日宣布,其备受开发者欢迎的在线平台 Google AI Studio 迎来重要更新,现已正式启用全新且更易于记忆的域名 ai.dev。 开发者可以通过此快捷地址轻松访问这一强大的工具,探索和构建各种生成式人工智能应用。 Google AI Studio 最初旨在为开发者提供一个无需复杂环境搭建即可快速上手体验和利用谷歌最新 AI 模型(如 Gemini 系列)的平台。
OpenAI 更新语音助手功能,让对话更自然流畅、减少打断频率
OpenAI 于本周一发布了其高级语音模式的更新,该功能允许用户与 ChatGPT 进行实时对话。 更新后的语音助手在交流中表现得更加人性化,并且减少了对用户的打断频率。 OpenAI 的后期培训研究员 Manuka Stratta 通过一段视频在公司官方社交媒体渠道上公布了这一消息。
大神卡帕西亲自演绎零基础开发APP,ChatGPT四轮对话搞定,一小时即在手机运行
大神卡帕西带着他的教程又来了! 这次不是教学视频,而是手把手教你如何用大模型开发APP——他没有阅读任何文档,也没有在专门平台Swift编程过,在与ChatGPT仅四轮对话的指导下,成功在手机上运行上了。 ,时长00:24这是个用来减肥跟踪APP。
国产AI芯片崛起!消息称蚂蚁集团训练成本骤降20%,媲美英伟达
据彭博社援引知情人士报道,蚂蚁集团在人工智能领域取得了重大突破,通过采用阿里巴巴和华为生产的中国芯片,成功将AI模型的训练成本削减了20%。 这一消息无疑为中国在关键技术领域的自主可控注入了新的动力。 报道进一步指出,蚂蚁集团的内部测试显示,这些中国制造的AI芯片在性能上能够与行业领导者英伟达的同类产品相媲美。
一文看懂多模态思维链DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
DeepSeek V3升级了,新版本V3-0324。 官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。 把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。
GenAI如何重新定义亚太地区的零售银行业务
GenAI采用的现状包括GPT-4等尖端语言模型在内的GenAI最新进展,正使金融机构能够以新颖的方式利用AI的能力。 合成数据生成——即使用算法而非现实世界收集来创建数据——已成为关键推动因素,为多样化的银行业务需求提供可扩展、自动化的解决方案。 然而,IDC的《2024年数据与AI脉搏》研究显示,东南亚地区的AI采用情况参差不齐。
阿里开源最新多模态模型 Qwen2.5-VL-32B:主打视觉语言,数学推理也很强
此前开源家族视觉语言模型 Qwen2.5-VL 包括 3B、7B 和 72B 三种尺寸。这一次的 32B 版本进一步兼顾尺寸和性能,可在本地运行。
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
就在DeepSeek-V3更新的同一夜,阿里通义千问Qwen又双叒叕一次梦幻联动了——发布Qwen2.5-VL-32B-Instruct。 此前开源家族视觉语言模型Qwen2.5-VL包括3B、7B和72B三种尺寸。 这一次的32B版本进一步兼顾尺寸和性能,可在本地运行。
DeepSeek V3“小版本升级”实测堪比 V3.5,非推理模型也有“啊哈时刻”
由于发布时间太短,还没有正式测评结果,不过在开发者 Xeophon 的个人 Benchmark 上所有指标都有大提升,成为该测试下最好的非推理模型。
AI引爆全美失业潮,12个月内接管所有代码!3亿岗位被取代,70%职业大换血
AI,正在改变生活。 LinkedIn的新研究显示,很大程度上因为AI,到2030年,大多数职业的70%技能将发生变化。 然而,更大的AI的冲击或许就要到来:AI永久性地改变就业市场,并带来大规模失业。
美国恐惧:冷战2.0将至,中国开源模型大爆炸临近!LeCun:DeepSeek只是卷王副产品
如今,美国已经开始陷入「冷战2.0焦虑」——我们的AI技术,恐怕已经落后于中国了? 甚至AI社区的不少人已经押注:接下来几个月,将有一大波中国开源AI模型的浪潮! 某AI大V如是说:一年前,没有人会预料到,在AI竞赛中,美国竟会被更强大的中国超越。
一文看懂多模态思维链
多模态思维链(MCoT)系统综述来了! 不仅阐释了与该领域相关的基本概念和定义,还包括详细的分类法、对不同应用中现有方法的分析、对当前挑战的洞察以及促进多模态推理发展的未来研究方向。 图片当下,传统思维链(CoT)已经让AI在文字推理上变得更聪明,比如一步步推导数学题的答案。
Nature:科研人员最爱AI工具大盘点!从推理到编程,哪款才是最佳助手?
几乎每周都有新的、令人影响深刻的AI工具发布,研究人员纷纷踊跃尝试。 从复杂的数学问题求解,到医学诊断中的精准分析,再到代码编写与论文创作,AI工具展现了巨大的潜力。 但市面上令人眼花缭乱的AI模型,究竟哪一款才是让科研工作者效率起飞的「梦中情模」,能助力科研突破,带来事半功倍的效果呢?
爆火Block Diffusion引发LLM架构变革?自回归+扩散模型完美结合
扩散模型被广泛应用于生成图像和视频,并且在生成离散数据(如文本或生物序列)任务上的效果也越来越好,与自回归模型相比,扩散模型有望加速「生成过程」并提高模型输出的「可控性」。 然而,离散扩散模型目前仍然有三个局限性:在聊天系统等应用中,模型需要生成任意长度的输出序列(例如,对用户问题的回答),但大多数现有的扩散架构只能生成固定长度的向量;离散扩散在生成过程中使用双向上下文,因此无法利用键值缓存(KV caching)复用之前的计算,使得推理效率较低。 从困惑度等标准指标来看,离散扩散模型的质量仍落后于自回归方法,也进一步限制了其应用范围。
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
昨晚,DeepSeek-V3悄然升级! 新模型版本为DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。 从发布时间和技术特点来看,DeepSeek-V3-0324,很可能是DeepSeek-R2的基础架构。
韩国AI芯片初创公司FuriosaAI拒绝Meta 8亿美元收购
据韩国当地媒体报道,专注于人工智能应用芯片研发的初创公司FuriosaAI近日拒绝了科技巨头Meta提出的高达8亿美元的收购要约。 FuriosaAI方面表示,将继续专注于自主研发和生产其AI芯片。 报道指出,此次收购谈判破裂的主要原因在于收购后双方在业务战略和组织结构方面存在分歧,而非收购价格本身。
中国AI黑马DeepSeek-V3震撼登场:20令牌/秒运行速度,能否改写AI格局?
中国人工智能初创公司DeepSeek悄然发布了大型语言模型DeepSeek-V3-0324,在人工智能行业引发了震动。 该模型以641GB的体量现身于AI资源库Hugging Face,此次发布延续了DeepSeek低调却极具影响力的风格,没有大肆宣传,仅附带空的README文件和模型权重。 这款模型采用MIT许可,可免费用于商业用途,且能在消费级硬件——配备M3Ultra芯片的苹果Mac Studio上直接运行。
王炸!DeepSeek-V3-0324悄然发布 ,免费商用,消费级电脑也能跑!
DeepSeek 悄然发布了其最新的大型语言模型 DeepSeek-V3-0324,在人工智能行业内引发了强烈反响。 这款 容量高达641GB 的模型悄然出现在 AI 模型库 Hugging Face 上,几乎没有任何事先宣传,延续了该公司低调但极具影响力的发布风格。 性能飞跃,媲美 Claude Sonnet3.5DeepSeek-V3的发布之所以引人注目,不仅在于其强大的功能,更在于其部署方式和许可协议。