AI在线 AI在线

人工智能

AI抢不走的工作,微软力挺红队测试仍需人类“掌舵”

随着AI的快速发展,安全专家担心人工智能会取代他们的工作,但微软的研究人员坚持认为,有效的红队测试仍然依赖于人类的专业知识、文化意识和情商——这些品质是机器无法复制的。 微软的AI红队严格测试了100多款生成式AI产品,并确定人类的创造力在发现漏洞,以及预测黑客如何利用这些系统方面仍然至关重要。 根据雷德蒙德AI红队发布的白皮书,其开源的PyRIT(Python风险识别工具包)等工具可以简化模拟黑客攻击,但最终,在处理复杂风险方面,人类的参与仍然不可替代。
1/15/2025 7:38:07 AM
跳舞的花栗鼠

研究:训练数据含 0.001% 的错误信息足以“毒害”医学 AI 模型

纽约大学的一项研究揭示了大型语言模型(LLM)在医学信息训练中的潜在风险。研究表明,即使训练数据中仅含有 0.001% 的错误信息,也可能导致模型输出不准确的医学答案。
1/14/2025 5:21:49 PM
远洋

英伟达推进合作,旨在加速人工智能代理在医疗保健研究中的应用

这些合作基于英伟达的“人工智能工厂”概念,即把原始数据转化为可操作的人工智能模型或“tokens”的数据中心,这些模型或“tokens”可作为各种应用的智能工具。 这些联盟还旨在开发能力更强的代理,即具有决策能力的自主行动数字机器人,这些机器人通常以目标或目的为指导。 代理系统可以规划、推理和执行多步骤的任务,适应不断变化的环境和背景,超越回答问题,发起行动。
1/14/2025 2:37:35 PM
PAUL GILLIN

CES 2025的十大“人工智障”产品

人工智能是CES 2025的核心主题。 然而,人工智能不是万能锤子,并非所有的创新都是“好”的创新。 在今年的展会上,国外一群“砖家”评选出了CES 2025的十大“人工智障”产品,包括滥用隐私监控技术的家电和功能过剩的智能设备,这些产品因存在维修困难、隐私风险高、对环境不友好等问题被看作是“智商税”产品。
1/14/2025 2:17:20 PM
佚名

思维链?思维树?华为诺亚:现在到了思维森林时刻!

OpenAI 接连发布 o1 和 o3 模型,大模型的高阶推理能力正在迎来爆发式增强。 在预训练 Scaling law “撞墙” 的背景下,探寻新的 Scaling law 成为业界关注的热点。 高阶推理能力有望开启新的 Scaling law,为大模型的发展注入新的活力。
1/14/2025 1:52:56 PM

国产推理大模型决战2025考研数学,看看谁第一个上岸?

随着上个月 2025 研究生考试的结束,最新的考研数学真题成为大语言模型尤其是推理模型的「试炼场」,将考验它们的深度思考能力。 业内曾有着这样一种共识:大语言模型在文字水平上的表现令人印象深刻,但说到数学就不甚令人满意了。 去年一度火出圈的「9.9 与 9.11」比大小的问题,包括 GPT-4o 在内的很多大模型都翻车了,直到深度推理模型出现后才从根本上改善了这一状况。
1/14/2025 1:51:18 PM

最强代码模型刷新:Mistral新品上线即登顶,上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral,又上新了! 而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐,共同位列 Copilot 竞技场第一名。 上下文窗口也增长到了之前的 8 倍,达到了 256k。
1/14/2025 12:22:06 PM

2025年的AI与数据创新:影响企业成功的五大预测

打开电视或流式播放最新的新闻广播,你很可能会以某种方式听到AI被提及,显然,与过去几年一样,AI如今仍然盛行。 对于一些消费者和企业而言,公司可能夸大了这项新兴技术的重要性。 AI这个,AI那个……但现实是,AI已成为不可逆转的趋势,并将在全球技术的未来、消费者与技术的互动方式以及企业的运营方式中发挥巨大作用。
1/14/2025 10:55:18 AM
Venkat Achanta

Adobe 推出新款生成式 AI 工具,可一键批量编辑 1 万张图像

今日 Adobe 宣布推出一系列全新的生成式 AI 工具,旨在自动化处理劳动密集型生产任务,例如批量编辑图像和翻译视频演示文稿。其中最引人注目的是“Firefly Bulk Create”应用,该工具允许用户一键快速调整多达 10,000 张图像的尺寸或替换所有背景,从而避免繁琐的逐张编辑操作。
1/13/2025 10:45:48 PM
远洋

英国政府计划采购 10 万块 GPU,将公共部门 AI 算力提升 20 倍

英国首相斯塔默承诺,到 2030 年英国政府将采购多达 10 万块 GPU,这意味着英国主权 AI 算力将增加 20 倍,主要用于学术界和公共服务领域的 AI 应用。
1/13/2025 7:54:59 PM
远洋

人工智能革命推动电力需求激增,美国兴起天然气发电厂建设热潮

据金融时报报道,随着大型科技公司转向化石燃料以满足人工智能革命带来的巨大电力需求,美国正迎来天然气发电厂建设的热潮,这一趋势可能危及气候目标的实现。能源咨询公司 Enverus 表示,到 2030 年,美国将新建多达 80 座天然气发电厂,新增装机容量达 46 吉瓦,相当于挪威整个电力系统的规模,比过去五年新增容量高出近 20%。
1/13/2025 6:06:54 PM
远洋

从今以后,所有淘宝天猫商家都能一键图生视频了

这两年,大模型作为前沿技术,正逐步深入电商行业的各个环节。 2025,这一变革仍在加速:近日,【淘宝星辰 · 图生视频】工具已重磅上线,并对淘宝天猫商家正式开放!
1/13/2025 12:32:24 PM

Video Ocean V2.0:视频质量全面升级,依旧完全免费,薅羊毛的快乐等你来!

今日,潞晨 Video Ocean V2.0 正式来袭,本次升级不仅在模型、速度、功能玩法上 “大步进化”,还依旧完全免费,等着你来薅羊毛。 创新的技术架构和用户导向的视频生成体验为你呈现全新的数字互动世界。 全面升级:不止于 “想得到”,更要 “拍得到”在本次版本迭代中,我们对视频质量进行了全面升级:无论是人物、动物、环境,还是特写、近景、远景,画面精细度和真实感,都达到了全新的高度,带给你超级真实的样例。
1/13/2025 12:31:40 PM

o1不是聊天模型?24小时热度暴涨,奥特曼、Brockman在线围观

不要再将 o1 当做聊天模型了。 如何定位 o1 模型? 你是否常常将其当做一个聊天模型来使用。
1/13/2025 12:30:58 PM

最高工资322万!OpenAI开招机器人工程师

OpenAI真的要重启机器人计划了。 总裁Brockman转发了一则招聘公告,招募机器人硬件工程师。 这则通告由OpenAI从Meta挖过来的技术人员Caitlin Kalinowski(被挖前任Orion眼镜负责人)发布,一共包含三大岗位,开出了最高44万美元(约322万人民币)的薪水。
1/13/2025 11:49:37 AM

别再把o1满血版当聊天模型了!SpaceX前工程师公开全新使用秘籍:从讨厌它到每天依赖它

苹果&SpaceX前工程师分享o1使用心得,奥特曼、Brockman都转发了。 划重点:o1已经不是聊天模型了,需要全新的使用方法。 奥特曼还跑去挖坟作者Ben Hylak数天前的“自我打脸”评论,称“观察o1的口碑变化、以及人们学习如何使用它很有趣”。
1/13/2025 11:48:10 AM

2024年人工智能主流发展方向解析

引言2024年,人工智能(AI)技术如破茧之蝶,翩然飞入各行各业,成为推动社会进步的关键力量。 从基础研究的深耕到应用落地的拓展,AI正沿着多元化的轨迹迅猛发展。 本文将为您详细解析2024年AI的主流发展方向,带您领略这一前沿科技的无限魅力与广阔前景。
1/13/2025 9:44:16 AM
tune

扎克伯格大胆预测:AI 编程水平今年足以媲美中级工程师

“我认为大约在2025年,Meta以及其他致力于这项技术的公司,将会拥有一种人工智能,它能够有效地扮演你公司中的中级工程师角色,进行代码编写。”
1/13/2025 8:15:05 AM
清源