AI在线 AI在线

工具

帮助职场人士提高办公效率的十款免费人工智能工具

译者 | 李睿审校 | 重楼提高办公效率并不能只依赖埋头苦干。 在通常情况下,“巧干胜于蛮干”。 因此,为了持续领先,关键在于融合个人才智、专注投入,以及高效应对日常挑战的方案。
7/16/2025 8:37:02 AM
李睿

必须 AI 为第一作者!斯坦福发起的科研会议,接收 AI 投稿,AI 审稿、人类只能围观

2025年10月22日,名为“Agents4Science”的虚拟会议将正式召开。 这是全球首个明确规定:AI必须担任论文作者和评审人的科学会议。 图片地址:,所有提交的研究论文,必须由AI系统完成主要写作,并接受AI系统的同行评审。
7/14/2025 2:15:00 AM

饿了么联创悄悄做了一家 AI 公司,专攻效率工具

前饿了么联合创始人汪渊,我本以为他已经退休去享受生活了。 这种级别的创业者,早就实现财务自由。 早些年有朋友在饿了么,经常跟我讲饿了么创始人“四大饿”跌宕起伏的故事。
7/10/2025 11:23:24 AM
阿颖

首个GUI多模态大模型智能体可信评测框架+基准:MLA-Trust

MLA-Trust 是首个针对图形用户界面(GUI)环境下多模态大模型智能体(MLAs)的可信度评测框架。 该研究构建了涵盖真实性、可控性、安全性与隐私性四个核心维度的评估体系,精心设计了 34 项高风险交互任务,横跨网页端与移动端双重测试平台,对 13 个当前最先进的商用及开源多模态大语言模型智能体进行深度评估,系统性揭示了 MLAs 从静态推理向动态交互转换过程中所产生的可信度风险。 此外,MLA-Trust 提供了高度模块化且可扩展的评估工具箱,旨在为多样化交互环境中 MLAs 的持续性可信度评估提供技术支撑。
7/4/2025 4:50:07 PM

10分钟搞定Excel世锦赛难题!首个超越人类Excel Agent,网友:想给它磕一个

前段时间,我们报道了 5 款大模型参加了今年山东高考的事儿,为了弄清楚各大模型在 9 个科目中的具体表现,我们对着测评明细表挨个儿分析,搞得狼狈又崩溃。 要是哪个 AI 能一键分析表格,我当场就能给它磕一个。 现在,终于有 AI 来整顿 Excel 表格了!
7/4/2025 4:47:35 PM

AI代码工具大地震:Anthropic核心创始人集体"叛逃"Cursor背后的惊天内幕

昨天在Twitter上看到一条消息,差点让我手中的咖啡洒出来——Claude Code的创始人@bcherny和@_catwu离开了Anthropic,加入了Cursor AI。 这感觉就像是你精心培养的孩子,突然跑到隔壁邻居家说"爸爸,我要跟着他们混了"。 作为一个天天和各种AI编程工具打交道的开发者,我深知这件事背后的分量。
7/4/2025 9:21:50 AM
阿丸笔记

2025 年 AI 工具全栈开发引擎:从 PDF 到语音仪表板

从 PDFs 到视觉模型,从零样本智能体到语音交互仪表板,我将 2025 年的顶级 AI 工具融合成一个个人全栈开发引擎,彻底改变了我的开发方式。 一切的起点:技术栈我曾被各种工具淹没:• OCR 用一个库• 语音处理用另一个• 视觉模型再来一个• 嵌入、RAG、仪表板,每样都有单独的工具于是,我做了每个不堪重负的开发者最终会做的事:统一它们。 这就是魔法的开始。
7/4/2025 2:15:00 AM
AI研究生

马斯克放话:Grok-4 于 7· 4 后上线,专治“写码难”!

6月27日,马斯克发推宣布了 Grok-4 的最新动态:这一 xAI 最新一代大模型,将在 7 月 4 日之后发布。 据马斯克推特,这次是重点是面向开发者的“专业编码模型”升级。 Grok 是马斯克在 OpenAI 之外另起炉灶的尝试。
6/30/2025 1:00:00 AM

谷歌重磅开源Gemini CLI:免费AI工具,居然要干掉GitHub Copilot?

先说说我的第一印象6月25日那天,谷歌悄无声息地放出了Gemini CLI,Apache 2.0许可证,完全免费。 我当时就想,谷歌这是要和OpenAI正面刚了? 当Cursor靠着Claude 3.5在开发者群体里风生水起,GitHub Copilot还在那里慢悠悠地更新模型支持时,谷歌这招确实有点狠。
6/27/2025 2:29:00 AM
阿丸笔记

七款MCP工具,彻底改变我用 AI 写代码的方式

最近笔者在用Next.js写一个前端项目项目,半夜 11 点还在手动复制SQL表结构、Google各种JS报错信息。 PS:笔者是一个算法 后端工程师,对于前端的框架语法基本上只能靠搜索完成😭。 AI 编程助手不停地吐出过时的 React Hooks 或者是没理解我意思给出我不想要的代码,这让笔者极近崩溃,甚至想把电脑给砸了!
6/27/2025 1:22:00 AM
AI研究生

谢赛宁团队新基准让LLM集体自闭,DeepSeek R1、Gemini 2.5 Pro都是零分

近年来,LLMs(如 GPT-4、Claude、Gemini 等)在代码生成领域取得了显著进展。 它们不仅在经典编程基准(如 HumanEval)中表现出色,甚至在某些测试中超越了人类平均水平。 这促使许多研究者开始宣称:LLM 已经胜过人类程序员,尤其是在竞赛编程领域。
6/19/2025 9:04:00 AM

特朗普「全政府AI计划」竟在GitHub泄密!或于7月4日「独立日」上线

最新消息:再过不到一个月,特朗普政府就要启动一个超级计划,把AI推广到整个联邦政府! 美国总务管理局(GSA,联邦政府的采购部门)和它的技术转型服务(TTS)小组正在搞一个叫ai.gov的网站,目标是通过AI加速政府创新。 这消息是从GitHub上一个代码仓库里挖出来的,可惜发邮件一问,这仓库链接就无法显示了。
6/17/2025 9:19:16 AM

人类飞机上吵架看呆袋鼠」刷屏全网,7000万人被AI耍了

200 多年前,曹雪芹在《红楼梦》中写下这样一句话:假作真时真亦假,无为有处有还无。 翻译成大白话就是,当虚假被当作真实时,真实也会被视为虚假;当虚无被强行视为存在时,存在也会消解为虚无。 万万没想到,放在今天的 AI 语境下,这句古话竟精准地映照了现实。
6/17/2025 9:05:00 AM

一个数据集,一年产稿7876篇!AI强力加持,垃圾论文海量爆发

假如你是一位科研期刊的编辑,每天打开邮箱,迎接的却是一堆似曾相识的论文。 它们主题各异,数据整齐,措辞流畅,但总有种让人不安的「模板感」。 这可不是一个瞎编的场景,而是2024年发生在《Scientific Reports》编辑Matt Spick身上的真实经历。
6/17/2025 8:53:00 AM

4B Qwen3逆袭671B DeepSeek!字节DAPO微调方法这么猛的吗

4B小模型极限在哪里? 最新模型Jan-nano引起热议,它在智能体任务上超过671B的最新版DeepSeek-V3 0528,在SimpleQA基准上获得80.7分。 先来看一下它的实际表现,包括两个任务:对研究某公司目前的扩张情况,该公司的扩张正威胁着另一家公司的市场份额,并撰写一份可能影响金融公司尽职调查流程的MBA水平报告。
6/17/2025 8:45:00 AM

别让千亿参数成摆设!万字解读LLM应用的生存法则

现在大家都在聊大模型,动不动就说什么“智能涌现”、“颠覆行业”。 但说实话,真正能把大模型用好的,不是谁喊得响,而是看谁的系统设计够硬核! 什么是大模型应用系统设计?
6/16/2025 8:06:51 AM
曹洪伟

八个几乎能替代一整个开发团队的AI工具

前言大家好,我是林三心,用最通俗易懂的话讲最难的知识点是我的座右铭,基础是进阶的前提是我的初心~一、代码生产维度的范式转移1. GitHub Copilot X(智能编程协作者)图片能力进化: 从代码补全到全栈架构建议,最新X版本可理解项目上下文进行智能重构案例实测: 在开发REST API时,自动生成符合OpenAPI规范的完整端点代码,节省65%编码时间不可替代性: 保留核心算法设计权的同时,将重复劳动压缩70%2. Replit Ghostwriter(云端智造引擎)图片突破性优势: 环境配置时间归零,支持50 语言实时协作实战场景: 快速验证区块链智能合约时,5分钟完成从构思到测试部署的全流程数据背书: 2024年独立开发者调研显示,使用该工具的原型验证速度提升400%二、产品设计链路的智能跃迁3.
6/16/2025 5:10:00 AM
林三心不学挖掘机

程序员从此不再写代码!红杉专访Codex团队,o3白菜价真相曝光

未来的AI Coding会是什么样子? Copilot、Cursor、Windsurf还是Claude Code? 都不是!
6/13/2025 2:22:04 PM