资讯列表
腾讯混元全新推理模型 T1 官宣:3 月 21 日发布
腾讯混元今日通过官方公众号宣布,全新的推理模型T1将于本周五(IT之家注:北京时间3月21日23时)正式发布。
黄仁勋发布英伟达最强芯片,人形机器人时代正式倒计时
祭出史上最强 AI 芯片的同时,也画下了好几个大饼。
腾讯元宝近一个月日活激增超 20 倍,此前已接入 DeepSeek
今日腾讯总裁刘炽平在 2024 年年报媒体沟通会上披露,旗下 AI(人工智能)助手腾讯元宝 2 月至 3 月日活(DAU)激增超 20 倍,成为了中国 DAU 排名第三的 AI 原生移动应用。
英伟达 CEO 黄仁勋:人形机器人将在 5 年内广泛应用于制造业
英伟达CEO黄仁勋预测,人形机器人将在五年内广泛应用于制造业,特别是在受控的工厂环境中。黄仁勋强调,这种技术的经济成本已相当合理。#人形机器人##制造业革命#
美国法院判决:无人工参与的 AI 创作作品不能获得版权保护
法院支持美国版权局的立场,认为由斯蒂芬·塔勒(Stephen Thaler)设计的AI系统“DABUS”生成的图像不符合版权保护条件,只有人类创作的作品才能获得版权。
哥大最新调研:多款 AI 搜索引用错误率高达 60%,付费版本错误率更高
AI 搜索工具在美国很火,几乎四分之一的美国人都表示他们已经用 AI 来取代了传统的搜索引擎。 然而在享受便捷的同时,也潜藏着诸多问题。 例如,AI 会直接引用网络上原始文章的内容,但这些内容是否符合指令要求,却是一件极为不确定的事情。
Anthropic正为Claude聊天机器人开发语音功能 人机交互或迎新变革
就在各家AI大模型竞相迭代之际,一家备受瞩目的人工智能初创公司Anthropic正悄然酝酿着一项重大升级——为旗下AI聊天机器人Claude赋予“说话”的能力。 Anthropic首席产品官迈克・克里格(Mike Krieger)近日向英国《金融时报》透露,公司正积极探索一系列全新的用户体验,让用户能够直接通过语音与强大的Claude AI模型进行交流。 克里格指出,随着Claude的应用场景不断拓展,尤其是在桌面端,语音交互有望成为一种更加自然和高效的用户界面。
招商证券:公司目前已部署DeepSeek系列模型 接入办公交流软件
招商证券在互动平台表示,公司已部署DeepSeek系列模型,当前主要接入公司办公交流软件,支持员工日常办公需要。 未来公司将全方位使用R1 类强推理模型进行业务数智化升级,围绕智能投顾、智能投资、智能投研等核心业务进行落地探索。
三星重磅官宣!One UI 7携AI超能力4月7日全球启动更新,你的手机准备好了吗?
三星粉丝们注意了!这家科技巨头正式宣布,基于Android15的最新手机操作系统One UI7即将登场,并将于4月7日起在全球范围内陆续推送至现有手机和平板电脑。 美国地区的用户稍作等待,更新将于4月10日开始推送。 在美国,首批尝鲜One UI7的将是三星2024年的旗舰机型Galaxy S24系列,以及备受期待的折叠屏手机Fold6和Flip6。
比Manus好使!实测谷歌AI显眼包:三秒唠出一个网页,文件直接开口说相声
编辑 | Sia刚晒完「用嘴 P 图、去水印」的神技,一觉醒来谷歌 Gemini 它又上新了! 大伙儿直接对着电脑屏幕发出一阵,啊! 免费体验传送门: Gemini 网页,对话框里突然蹦出个新玩具:Canvas!
IBM与Hugging Face联手放大招!开源“文档解密神器”SmolDocling,复杂文档一键变结构化数据!
话说在计算机科学领域,将那些结构复杂的文档变成规整的数据,一直是个让人头疼的“老大难”问题。 以前的“土办法”,要么是各种模型“组团出道”,搞出一套复杂的流程,要么就得祭出“巨无霸”级别的多模态模型,虽然看起来很厉害,但动不动就“幻觉”,还特别“烧钱”。 不过最近由IBM和Hugging Face联手推出的SmolDocling,只有256M参数的开源视觉-语言模型(VLM),目标非常明确,就是要端到端地解决多模态文档转换的任务。
原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源
近年来,大型语言模型(LLM)通过大量计算资源在推理阶段取得了解决复杂问题的突破。 推理速度已成为 LLM 架构的关键属性,市场对高效快速的 LLM 需求不断增长。 其中,采用 Transformer 架构的模型虽然占据了主流,但在输入序列长度增加时,计算量会呈二次方增长。
CVPR 2025|复旦&微软开源StableAnimator: 首个端到端ID一致性人类视频生成,Github Star破千
第一作者、第二作者分别为复旦大学研究生涂树源、邢桢,通讯作者为复旦大学吴祖煊副教授。 近年来,扩散模型在图像与视频合成领域展现出强大能力,为图像动画技术的发展带来了新的契机。 特别是在人物图像动画方面,该技术能够基于一系列预设姿态驱动参考图像,使其动态化,从而生成高度可控的人体动画视频。
Anthropic 正为 Claude 聊天机器人开发语音功能,已和多方商讨合作
Anthropic公司正为其AI聊天机器人Claude开发语音功能,旨在提供更自然的用户界面。首席产品官Mike Krieger透露,公司已开发出语音功能原型,并与亚马逊及ElevenLabs等合作伙伴进行会谈,以加速语音体验的推出。
谷歌研发全新 AI 模型 TxGemma,助力新药物发现及研究
谷歌表示,这些 AI 模型将在本月晚些时候通过其 Health AI Developer Foundations 计划发布,能够理解“常规文本”,并解析化学物质、分子和蛋白质等不同“治疗实体”的结构。
谷歌 Gemini 新增 Canvas 与音频概览功能,提升用户生产力
谷歌Gemini新增Canvas与音频概览功能,提升用户生产力。Canvas提供互动空间,支持写作与编程项目,音频概览则生成播客风格摘要。功能全球免费开放,助力创意实现。#谷歌Gemini##AI生产力#
腾讯最新财报显示AI战略进入重投入期 全年研发投入707亿
腾讯近期发布的财报数据显示,公司正全面加速AI领域的投入与布局。 2024年,腾讯研发投入达706.9亿元,七年累计投入已高达3912亿元。 资本开支方面更是亮眼,连续四个季度实现同比三位数增长,年度资本开支突破767亿元,同比增长221%,创下历史新高。
与DeepMind展开合作,英伟达的物理世界AI正在拓展版图
老黄:机器人的时代已经来临了。