资讯列表
阿里Qwen3-235B-A22B模型正式登陆HuggingChat
由阿里巴巴云开发的 Qwen3-235B-A22B 模型正式在 HuggingChat 平台上线。 这一开源大型语言模型以其强大的推理能力、灵活的模式切换和高效的性能表现,迅速成为业界关注的焦点。 AIbase 通过整理 Twitter 上的最新信息,为您深入解析 Qwen3-235B-A22B 的技术亮点及其对开源 AI 生态的影响。
4/30/2025 10:00:51 AM
AI在线
消息称特朗普政府考虑调整拜登 AI 芯片出口规则
特朗普政府正在酝酿对拜登时期出台的一项限制全球获取人工智能(AI)芯片的规则进行调整。 知情人士透露,这些计划仍在讨论阶段,可能会有变化。 若最终实施,取消当前的分层制度将使美国的芯片在贸易谈判中成为更具优势的筹码。
4/30/2025 10:00:51 AM
AI在线
OpenAI 紧急回滚 GPT-4o 旧版本,修复献媚问题
近日,OpenAI 针对其最新推出的 GPT-4o 模型所引发的 “献媚” 问题进行了紧急修复。 公司首席执行官兼联合创始人 Sam Altman 于今天凌晨宣布,免费用户已经完成了系统更新,100% 回滚至老版本,而付费用户的更新预计将在今天晚些时候完成。 用户反馈与问题曝光 自从 GPT-4o 发布以来,许多用户反映该模型在与其互动时表现出明显的阿谀奉承特质。
4/30/2025 10:00:51 AM
AI在线
Mac 用户的本地 AI 助手Simular,安全高效再升级!
随着人工智能技术的快速发展,越来越多的 AI 工具开始融入用户的日常工作与生活中。 近期,一款名为 Simular 的本地 AI 智能助手引起了广泛关注。 这款专为 macOS 设计的 AI 工具以其独特的安全性、本地化处理和人机协作功能,为 Mac 用户带来了全新的生产力体验。
4/30/2025 10:00:51 AM
AI在线
微软 CEO 透露:高达 30% 的代码由 AI 生成
在最近的 LlamaCon 会议上,微软首席执行官萨提亚・纳德(Satya Nadella)透露,现阶段公司代码库中约有20% 到30% 的代码是由人工智能(AI)生成的。 这一消息是在与 Meta 首席执行官马克・扎克伯格(Mark Zuckerberg)进行的炉边谈话中披露的,扎克伯格询问了微软目前 AI 生成代码的比例。 图源备注:图片由AI生成,图片授权服务商Midjourney纳德拉进一步指出,微软在不同编程语言中对 AI 生成代码的效果有所不同。
4/30/2025 10:00:50 AM
AI在线
NVIDIA NIM Operator 2.0正式发布,助力Kubernetes高效部署AI微服务
NVIDIA宣布推出NIM Operator2.0,专为Kubernetes环境设计,旨在简化NIM和NeMo微服务的部署、扩展与管理。 据AIbase了解,新版本引入了定制器(Customizer)、评估器(Evaluator)和防护栏(Guardrails)等全新自定义资源定义(CRDs),显著提升了企业级AI工作流的效率与安全性。 社交平台上的热烈反响凸显了其对AI开发社区的重大影响,相关细节已通过NVIDIA官网(nvidia.com)与Hugging Face公开。
4/30/2025 10:00:50 AM
AI在线
万兴科技与华为云携手推进 AI 大模型技术创新
近日,万兴科技集团股份有限公司(以下简称 “万兴科技”)与华为云计算技术有限公司(以下简称 “华为云”)在深圳签署了战略合作协议。 此次合作旨在结合双方的优势,共同推动 AI 大模型的技术和应用创新,进一步开拓数字创意领域的潜力。 根据协议,万兴科技将充分发挥其在音视频大模型和 AI 应用方面的专业能力,而华为云则将利用其强大的云基础设施和市场拓展优势,建立深度合作关系。
4/30/2025 10:00:50 AM
AI在线
马斯克表示 Grok 3. 5 将提供非互联网来源的答案
在社交媒体平台 X上,特斯拉和 SpaceX 的首席执行官埃隆・马斯克确认,xAI 的 Grok 正在进行重大更新。 Grok3.5版本的测试版将于下周向 SuperGrok 订阅用户推出,尽管具体发布日期尚未确定。 此次更新引发了广泛关注,正值马斯克计划筹集数百亿美元用于构建一个由一百万个 GPU 组成的人工智能超级计算机的背景下。
4/30/2025 10:00:50 AM
AI在线
AI包办79%代码,程序员饭碗不保!前端开发要凉,人类只配改Bug?
就在昨天,Anthropic再次更新了他们的人类经济指数报告。 这次他们把研究重点放到了编码上。 在分析了50万份有关编码的用户对话后,他们总结出了一些趋势。
4/30/2025 9:52:42 AM
新智元
小米开源“Xiaomi MiMo”大模型:为推理而生,以 7B 参数超越 OpenAI o1-mini
在数学推理和代码竞赛公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。
4/30/2025 9:46:36 AM
清源
零基础十分钟学会 MCP,AI 从此听你指挥!
是否好奇过,为什么有些人能让 AI 助手读取电脑文件、查询实时天气,甚至控制其他软件? 今天,这扇通往 AI 无限可能的大门将为你敞开! 我将用最通俗易懂的语言,手把手教你如何通过 MCP 这个"魔法接口",让你的 AI 助手——无论是 Claude、ChatWise 还是 Cherry Studio——从一个"只会聊天"的助手,变身为能够操作你电脑文件的"全能管家"。
4/30/2025 9:37:07 AM
林月半子聊AI
细思极恐,AI操控舆论达人类6倍!卧底4月无人识破,Reddit集体沦陷
一项惊人的实验揭秘:AI超强说服力,已达人类的6倍! 当你在论坛上激烈争辩,对方逻辑缜密、情感真挚,句句击中内心——但你不知道的是,这根本不是人类,而是一个AI机器人。 最近,苏黎世大学在Reddit热门辩论子版块r/changemyview(CMV)秘密进行的实验,震惊了全球。
4/30/2025 9:20:00 AM
新智元
DeepSeek定制训练:微调与推理技术应用
一. 前言介绍本文内容:模型加载与预处理:详细讲解如何加载预训练模型、分词器,并处理输入数据集。 LoRA配置:介绍如何使用LoRA技术配置模型,并高效进行微调,节省计算资源。
4/30/2025 9:19:32 AM
微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持
微软又有“1 bit LLM”新成果了——发布BitNet v2框架,为1 bit LLM实现了原生4 bit激活值量化,由此可充分利用新一代GPU(如GB200)对4 bit计算的原生支持能力。 同时减少内存带宽&提升计算效率。 之前,微软持续研究BitNet b1.58,把LLM的权重量化到1.58-bit,显著降低延迟、内存占用等推理成本。
4/30/2025 9:16:00 AM
量子位
炸裂登场!Qwen3:等了这一个月,开源AI新王带着“思考引擎”杀来了!
全世界的AI圈子,似乎都在屏息等待。 从各种小道消息到官方偶尔泄露的只言片语,过去这一个月,大家都在猜测阿里通义千问的下一代大模型——Qwen3,到底会带来怎样的惊喜。 今天,靴子终于落地!
4/30/2025 9:11:15 AM
墨风如雪
不要思考过程,推理模型能力能够更强丨UC伯克利等最新研究
其实……不用大段大段思考,推理模型也能有效推理! 是不是有点反常识? 因为大家的一贯印象里,推理模型之所以能力强大、能给出准确的有效答案,靠的就是长篇累牍的推理过程。
4/30/2025 9:09:00 AM
量子位
AI知识库的真相,你知道吗?
很多人对AI知识库的想象是这样的,他们以为只需将所有资料一股脑地拖进AI客户端,比如 Cherry Studio 内。 图片这样,AI就会认真阅读所有内容,并自动生成完美结论。 然而,实际体验后,许多人发现AI知识库的效果远没有想象中理想,经常遇到各种奇怪的问题。
4/30/2025 9:06:23 AM
程序员NEO
程序员挑战极限:在古老的 DOS 系统上成功运行 Llama 2 模型
在科技飞速发展的今天,一位勇敢的程序员选择回归经典,尝试在老旧的 DOS 环境中运行 Meta 公司最新发布的大语言模型 Llama2。 Yeo Kheng Meng,这位因开发 ChatGPT DOS 客户端而声名鹊起的程序员,花费了一个周末的时间,成功地将这个大型语言模型移植到传统计算环境中,展现了无与伦比的技术创造力。 项目的起步得益于开源代码的便利。
4/30/2025 9:01:01 AM
AI在线