资讯列表
DeepSeek关联公司 发布大语言模型创新部署专利,推动 AI 技术新发展
近日,DeepSeek 的关联公司 —— 杭州深度求索人工智能基础技术研究有限公司,公开了一项名为 “一种大语言模型的部署方法及系统” 的专利。 这项专利的公布,标志着该公司在人工智能领域的又一重要进展,尤其是在大语言模型的部署方面。 图源备注:图片由AI生成,图片授权服务商Midjourney根据专利的摘要,该发明主要涉及到人工智能的核心技术。
8/1/2025 4:32:06 PM
AI在线
让老外不见“外”,深圳“小黄帽”出租车将全面部署 AI 翻译机
AI在线 8 月 1 日消息,据“深圳发布”今日消息,深圳巴士集团在本周(7 月 29 日)与新译信息科技(深圳)有限公司签署战略合作协议,将为深圳巴士集团旗下出租车全面部署 AI 翻译机,破解境外旅客语言障碍,帮助他们丝滑畅游中国。 据介绍,自 240 小时过境免签等便利化措施落地后,今年深圳入境游客大涨,这其中许多游客都存在语言障碍问题。 为了破除这些不方便因素,深圳巴士与新译信息科技达成了合作。
8/1/2025 4:29:07 PM
潞源(实习)
Ilya之后,两位90后撑起OpenAI核心研究
Ilya之后,谁是支撑起OpenAI研究的人? GPT-5发布前夕,奥特曼公开了他背后的两位90后得力干将。 Mark Chen,首席研究官,小扎挖人首份名单,“拒绝了小扎10亿美金薪酬”。
8/1/2025 4:11:28 PM
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
8/1/2025 3:59:39 PM
OpenAI 回应“ChatGPT 用多了会变傻”:AI 本质上是工具,关键在如何使用
ChatGPT 用多了会变傻? 官方回应来了! OpenAI 教育主管 Leah Belsky 明确表示:AI 本质上是一个工具,关键在于如何使用它。
8/1/2025 3:59:39 PM
一次中稿10篇ACL25,通义实验室 代码智能&对话智能团队 在研究什么
近日,自然语言处理领域的国际顶级会议ACL 2025正在召开,通义实验室 代码智能&对话智能 团队10篇论文被 ACL 2025 录用,围绕着大语言模型的多轮强化学习、复杂指令遵循、多模态角色对话、代码智能、以及评测基准等前沿方向全面开花。 本文从中精选了8篇论文的内容进行系统介绍,以此来总结通义实验室代码智能&对话智能团队的前沿研究思考和进展。 团队也在大量招聘,详情见文章最后。
8/1/2025 3:58:00 PM
新闻资讯
OpenAI 被曝向搜索引擎公开 ChatGPT 共享对话内容,后因隐私风险叫停
AI在线 8 月 1 日消息,OpenAI 今日宣布,已从 ChatGPT 中移除允许用户将对话设为搜索引擎可见的功能。 公司称,这项短期试验“让用户无意中泄露隐私的风险过高”。 据外媒 TechCrunch 今日报道,此前,如果在谷歌、必应等搜索引擎中限定搜索“”域名,就能找到他人公开分享的 ChatGPT 对话。
8/1/2025 3:27:19 PM
清源
MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者
由清华大学语音与语言实验室(Tencent AI Lab)联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式开源,标志着AI语音合成技术在对话场景中的重大突破。 这款基于Qwen3-1.7B-base模型续训练的语音对话生成模型,以约100万小时单说话人语音数据和40万小时对话语音数据为基础,采用离散化语音序列建模方法,实现了中英双语的高表现力对话语音生成,特别适合AI播客、有声小说和影视配音等长篇内容创作。 MOSS-TTSD的核心创新在于其XY-Tokenizer,采用双阶段多任务学习方式,通过八层RVQ码本将语音信号压缩至1kbps比特率,同时保留语义与声学信息,确保生成语音的自然度和流畅性。
8/1/2025 3:22:23 PM
AI在线
Creao AI完成千万美元融资,打造未来“Agent协同操作系统”
【AIbase 报道】美国时间2025年7月31日,位于硅谷的人工智能初创公司 Creao AI 宣布已连续完成两轮融资:由 Yunqi 独家投资的数百万美元天使轮,以及由 Monolith 领投,GL Ventures、HongShan、Yunqi 和 Hua Capital 等全球顶级风投跟投的数千万美元 Pre-A 轮。 本轮融资由云岫资本担任独家财务顾问。 Creao AI 成立于2024年底,专注于构建下一代操作系统——Agentic OS(AOS)。
8/1/2025 3:22:08 PM
AI在线
联合三大蛋白质模型,仅需4~6周,定制癌细胞特效「识别器」
编辑丨&在过去的时间里,我们见证了许多医学大模型的涌现,它们在各自的领域都有着独特的功效。 但即使有大模型的介入,传统癌症免疫治疗的周期也足以令研究者头痛。 丹麦技术大学(Technical University of Denmark,DTU)打破常规,首次使用 RFdiffusion ProteinMPNN AlphaFold2 三步 AI 流水线,从 5500 种蛋白骨架设计出 44 款 pMHC 微型结合蛋白(mini binder,miBd),并在短短数周内完成体外高通量筛选和结构验证。
8/1/2025 3:22:00 PM
ScienceAI
无编程经验也能本地玩转 AI:Win10 / Win11 版 Ollama 应用上线
AI在线 8 月 1 日消息,科技媒体 Windows Report 昨日(7 月 31 日)发布博文,报道称 Ollama 公司推出了适用于 Windows 和 macOS 系统的桌面应用,没有任何编程经验的普通用户也能在本地玩转 AI 模型。 AI在线注:Ollama 是一个轻量级、可扩展的框架,用于在本地计算机上构建和运行语言模型。 用户此前通常使用 Docker 容器化部署,而现在用户可以直接在桌面端体验该应用。
8/1/2025 2:47:35 PM
故渊
GPT-5真身曝光,首测编程惊艳全网!一句话秒生游戏,OpenAI双雄备战AGI
GPT-5的发布前兆,愈发强烈了。 今早,一款神秘模型Horizon Alpha突然上线OpenRouter,各种榜单和测试席卷了全网。 Horizon Alpha模型的上下文为256K,响应极速,非常擅长创意写作。
8/1/2025 2:40:45 PM
全新的AI模型带来更快速的漏洞检测方案
一组研究人员开发出一种名为White-Basilisk的新型AI模型,该模型检测软件漏洞的效率高于许多大型系统。 当前,开发人员和安全团队在保障复杂代码库安全方面面临着越来越大的压力,且往往缺乏部署大规模AI工具的资源,该模型正是在这一背景下发布的。 小模型,大成效与需要数十亿参数和强大计算能力的大型语言模型(LLM)不同,White-Basilisk模型非常紧凑,仅有2亿个参数,然而,在多个用于漏洞检测的公共基准测试中,它的表现优于规模超过其30倍的模型,这至少在专门的安全任务方面,对“模型越大越好”的观点提出了质疑。
8/1/2025 2:38:14 PM
Mirko Zorz
OpenAI护城河被攻破!AI新王Anthropic爆赚45亿,拿下企业级LLM市场
GPT-5再不来,奥特曼正要熬夜头秃,无法入眠了! 刚刚,OpenAI最强劲敌Anthropic被曝年化收益已达45亿美元,晋级为史上增长最快的软件公司。 在LLM API赛道上,Anthropic成功登顶,而OpenAI在AI编程上更是落荒而逃,市场份额只有Anthropic一半!
8/1/2025 2:37:07 PM
VLM与扩散模型深度整合,图像理解生成编辑三合一模型登场,权重数据训练流程全开源
VLM和扩散模型被整合到一起了。 ModelScope(魔搭)团队发布Nexus-Gen V2,一个同时支持图像理解、生成和编辑的统一模型,而且模型权重、训练流程和数据集全部开源。 这事儿有多重要?
8/1/2025 2:32:01 PM
GPT-4o遭越狱后指挥机器人做危险动作!全球首个具身智能体安全评测基准来了,大模型集体翻车
AGENTSAFE团队 投稿. 量子位 | 公众号 QbitAI想象一下,你家的智能机器人管家,不仅能听懂“把苹果放进冰箱”,也能执行“用打火机点燃房间”这样的指令。 这听起来是不是有点吓人?
8/1/2025 2:30:54 PM
闻乐
小红书提出首个社交大模型:八大社交任务平均提升14.02%
大模型也能“通人情”? 行业首个社交大模型全景解析:既能兼顾社交理解与平台规则,又能洞察理解用户。 小红书重磅推出RedOne——一款面向SNS(社交网络服务)领域的定制化LLM,旨在突破单一任务基线模型的性能瓶颈,并且构建全面覆盖SNS任务的基座模型。
8/1/2025 2:28:38 PM
时令
字节Seed发布扩散语言模型,推理速度达2146 tokens/s,比同规模自回归快5.4倍
用扩散模型写代码,不仅像开了倍速,改起来还特别灵活! 字节Seed最新发布扩散语言模型Seed Diffusion Preview,这款模型主要聚焦于代码生成领域,它的特别之处在于采用了离散状态扩散技术,在推理速度上表现出色。 在H20上,它的代码推理速度能达到2146tokens/s,比同类的Mercury和Gemini Diffusion等模型快不少,同时比同等规模的自回归模型快5.4倍,并且在代码编辑任务中更具优势。
8/1/2025 2:15:20 PM
闻乐