AI在线 AI在线

应用

百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径

马上就要进入蛇年了,国内的 AI 厂商们却完全没有闲下来的意思,正在春节前扎堆发布各自的新一代大模型。 本周一,豆包刚刚上线了全新的实时语音功能,可说是在中文语音对话方面做到了断崖式领先,为终端用户带来了智商与情商双高的实时语音助手和聊天伙伴。 第二天,月之暗面与 DeepSeek 都各自推出了可比肩满血版 o1 的推理模型,吸引了中外无数眼球。
1/23/2025 12:01:00 PM
机器之心

马斯克贴脸开大星际之门项目:他们根本没钱,奥特曼是骗子

昨天,美国科技界发生了一件大事:美国新任总统特朗普联合 OpenAI CEO 奥特曼、软银 CEO 孙正义宣布了一个名为「星际之门」(Stargate Project)的人工智能项目。 该项目将成立一家公司,计划未来四年内投资 5000 亿美元,并立即开始部署 1000 亿美元,为 OpenAI 在美国建设新的人工智能基础设施。 此举旨在确保美国在人工智能领域的领导地位,同时创造数十万个新就业岗位。
1/23/2025 11:54:00 AM
机器之心

刚刚!ASP-DAC 2025最佳论文出炉,无问芯穹上交大论文获奖

让 AI 视频生成更快更省。 就在刚刚,集成电路设计自动化领域的国际传统顶级会议之一的 ASP-DAC(Asia and South Pacific Design Automation Conference, 亚洲及南太平洋设计自动化会议)在日本东京落下帷幕。 在 ASP-DAC 成立 30 周年之际,今年的前端最佳论文奖颁发给了《ViDA: Video Diffusion Transformer Acceleration with Differential Approximation and Adaptive Dataflow》—— 由无问芯穹与上海交通大学联合研究团队提出的视频生成软硬一体加速器,首次实现通过差分近似和自适应数据流解决 VDiT 生成速度缓慢瓶颈,推理速度相比 A100 提升高达 16.44 倍。
1/23/2025 11:50:00 AM
机器之心

英矽智能在Nature 子刊发表最新研究,利用量子-经典混合模型设计新型KRAS抑制剂

近期,英矽智能与加拿大多伦多大学共同主导的一项研究首次展示量子计算和人工智能在变革药物发现流程方面的潜力。 在这项研究中,科学家将量子计算模型与经典计算模型和生成式人工智能相结合,通过对庞大数据集的训练、生成和筛选,探索更广泛的化学可能性,发现靶向“不可成药”癌症驱动蛋白KRAS 的新颖分子。 这项研究也得到了圣裘德儿童研究医院等多方研究机构的支持,相关研究成果于1月22日发表于Nature Biotechnology。
1/23/2025 11:26:00 AM
新闻助手

刚刚!2024 ACM Fellow公布,周靖人、田奇、李国良、赵峰等多位华人入选

全球新入选 55 位科学家。 今天凌晨,美国计算机协会 ACM(Association for Computing Machinery)公布了最新一届会士名单。 ACM 创立于 1947 年,是全世界计算机领域影响力最大的专业学术组织之一。
1/23/2025 10:07:00 AM
机器之心

字节启动AGI长期研究计划,代号Seed Edge

1月23日,据媒体报道,字节豆包大模型团队已在内部组建AGI长期研究团队,代号“Seed Edge”,鼓励项目成员探索更长周期、具有不确定性和大胆的AGI研究课题。 接近字节的知情人士透露,Seed Edge的目标是探索AGI的新方法,代号名中Seed是豆包大模型团队名称,Edge代表最前沿的AGI探索。 Seed Edge鼓励跨模态、跨团队合作,为项目成员提供宽松的研究环境,实行采用更长周期的考核方式,以保障挑战真正颠覆性的AGI课题。
1/23/2025 9:29:00 AM
新闻助手

Adobe Premiere Pro 新增 AI 视觉识别搜索功能:一句话快速找到视频片段

今日 Adobe 为其视频编辑软件 Premiere Pro 引入了一项基于 AI 视觉识别的搜索功能,用户可以通过描述视频内容来快速查找相关片段。这一功能是 Adobe 在 Premiere Pro、After Effects 和 Frame.io 中新增的多项提升用户体验的功能之一,这些功能旨在帮助视频编辑者节省时间。
1/22/2025 10:46:14 PM
远洋

英国零售业拥抱自动化以降本增效,机器人包装工、AI 摄像头等逐渐普及

据英国《卫报》21 日报道,为了应对不断上涨的劳动力成本,英国零售商正加快采用电子货架标签、自动退货机、机器人包装工以及更多自助结账设备。
1/22/2025 10:11:57 PM
清源

Claude 创始人:AI 全面超越人类,只剩 2-3 年

他认为,AI 确有可能在短期内替代部分人类的工作,但让 AI 与人类形成互补才是对生产力最有益的方式。
1/22/2025 9:51:35 PM
清源

ChatGPT 每月产生 260 吨二氧化碳,与 260 趟纽约至伦敦航班碳排放相当

随着科技不断发展,进入 2025 年后,如何在技术创新和环境可持续性之间取得平衡,将成为科技企业和用户必须关注的核心议题。
1/22/2025 8:47:46 PM
清源

谷歌母公司 Alphabet 总裁:美国 AI 技术未必会永远领先中国

据彭博社报道,Alphabet 公司总裁兼首席投资官鲁斯・波拉特(Ruth Porat)表示,美国在人工智能(AI)发展竞赛中未必能保持对中国的领先优势。
1/22/2025 7:20:56 PM
远洋

可灵视频生成可控性为什么这么好?快手又公开了四篇研究

可灵,视频生成领域的佼佼者,近来动作不断。 继发布可灵 1.6 后,又公开了多项研究揭示视频生成的洞察与前沿探索 ——《快手可灵凭什么频繁刷屏? 揭秘背后三项重要研究》。
1/22/2025 6:21:00 PM
机器之心

「称霸」20年的谷歌翻译,一朝被小红书干沉默了

AI好好用报道编辑:杨文莲花脚皮片、硬气体毛……谷歌翻译闹出的那些国际笑话。 每天都在小红书上找乐子。 因为中外网友语言不通,唠嗑全倚仗谷歌翻译器。
1/22/2025 6:21:00 PM
AI好好用

百万 tokens 降至 0.8 元后,消息称字节跳动豆包大模型毛利率达 50%

据界面新闻今日援引多个知情人士消息称,字节跳动旗下的豆包大模型在去年大幅降价后,毛利率仍然为正。
1/22/2025 6:13:02 PM
清源

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

作者|朱可轩编辑|陈彩娴春节将近,各家厂商似乎都在争取休假前的最后一博,此时步入 2025 年也才半月有余,大模型玩家们已然卷上了新高度。 先是 OpenAI 打响了开年第一“枪”,ChatGPT 上线了新功能“Tasks”,主打提升了任务执行能力,之后国内一众厂商也先后发布了自家成果——月之暗面发布了全新的多模态图片理解模型 moonshot-v1-vision-preview;MiniMax 开源了基础语言模型 MiniMax-Text-01 和视觉多模态模型 MiniMax-VL-01;生数科技上新了视频大模型 Vidu 2.0;接着,智谱 AI 推出了端到端多模态大模型 GLM-Realtime;面壁智能带来了端侧多模态模型 MiniCPM-o 2.6;DeepSeek 开源了 DeepSeek-R1 推理模型......刚开年,模型更新便多到让人眼花缭乱,当中也不难发现,多模态、推理和端侧依旧是今年各家寻求突破的重点方向。 不得不提的是,在这一各厂商密集上新的“黄金节点”,AI 科技评论关注到,阶跃星辰一周内竟一口气批量更新了 6 款模型,全方位涵盖语言、语音、推理、图片理解、视频生成等多类别。
1/22/2025 5:02:00 PM
朱可轩

截胡 OpenAI:清华复旦等抢先开源智能体框架 Eko,一句话打造「虚拟员工」

清华、复旦和斯坦福的研究者联合提出了名为 Eko 的 Agent 开发框架,开发者可以通过简洁的代码和自然语言,快速构建可用于生产的「虚拟员工」。
1/22/2025 3:43:31 PM
清源

几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的

试想一个场景,职场中接到一个香港客户的单子,但是在交付的过程中耽搁了时间,现在要进行线上沟通解释,那么你面对的情况大致是这样的:如果不对这段音频进行标注,可能大部分人会认为这一粤语、英语混用的片段是真实发生或从TVB电视剧里截出来的。 但其实,这是由 AI 完成的配音,背后所使用的工具是海螺语音。 今年 1 月,继 MiniMax 发布并开源基础语言大模型 MiniMax-Text-01 和视觉多模态大模型 MiniMax-VL-01 后,再次推出了升级的语音大模型 T2A-01 系列,搭载于海螺 AI 之上,开辟海螺语音板块。
1/22/2025 2:07:00 PM
王悦

李飞飞:语言之外,另一半的智能还有待实现

「语言是人类的语言,而 3D 是自然的语言。 」「除了语言,我们还有另外一半智能,这部分非常深刻,就是我们做事的能力。 」「在 AI 之间加一个 G 以强调其通用性,我是尊重这个想法的。
1/22/2025 1:25:00 PM
机器之心