理论
使用人工智能幻觉评估图像真实感
译者 | 朱先忠审校 | 重楼引言最近,俄罗斯的一项新研究提出了通过一种非常规方法来检测不切实际的人工智能生成的图像。 这种方法的主要思想是:不是通过提高大型视觉语言模型(LVLM)的准确性,而是通过有意利用它们产生幻觉的倾向。 这种新方法使用LVLM提取有关图像的多个“原子事实”,然后应用自然语言推理(NLI)系统地衡量这些陈述之间的矛盾,从而有效地将模型的缺陷转化为检测违背常识的图像的诊断工具。
4/9/2025 8:23:49 AM
朱先忠
Ollama与vLLM部署对比:哪个更合适?
Ollama:简单易用的LLM部署工具 Ollama以其简洁的安装和易于使用的特性而闻名。 其官方文档清晰易懂,即使是新手也能快速上手。 Ollama支持多种LLM模型,并提供便捷的命令行界面进行管理和运行。
4/9/2025 8:20:00 AM
耗子
如何使用生成式人工智能工具简化应用程序迁移
译者 | 李睿审校 | 重楼将遗留代码和应用程序迁移到现代系统面临风险并且耗时费力,然而这一过程通常是不可避免的。 本文将阐述利用生成式人工智能工具简化应用程序迁移的一些有效策略。 一项研究表明,在财富5000强公司使用的软件中,多达70%的软件都是在20年前开发的。
4/9/2025 8:14:03 AM
李睿
入门级开发人员过度依赖AI的风险
每当ChatGPT等工具出现故障时,软件开发人员离开办公桌、休息片刻或沮丧地靠在椅背上,都不足为奇。 对于技术领域的许多专业人士而言,AI辅助的编码工具已成为一种便利。 甚至像2025年3月24日发生的短暂故障,也可能使开发工作陷入停滞。
4/9/2025 8:10:00 AM
Andrada Fiscutean
深度干货:DeepSeek+Dify强强联合,打造企业专属私有化AI知识库
在数字化转型的浪潮中,人工智能正以前所未有的速度渗透到企业运营的各个环节。 尤其对于算力需求旺盛的企业,例如那些关注Nvidia GPU、A800、H100等高性能计算资源的公司,以及积极探索AI Agent(如AutoGen、Devin AI)和低代码平台潜力的组织,如何安全、高效地利用AI提升内部知识管理和对外服务能力,成为其保持竞争力的关键。 本文将深入探讨如何通过DeepSeek强大的语言模型,结合Dify便捷的AI应用开发平台,构建一个私有化部署的企业知识库,为企业带来更智能、更安全、更高效的知识管理体验。
4/9/2025 8:00:46 AM
康焕新
机器人、智能设备的边缘AI即将问世
Souped up工业机器人和智能设备将彻底改变我们在边缘侧使用AI的方式,并加深我们对云和数据中心的理解。 人形机器人、智能设备和自动驾驶经常被引为边缘侧利润丰厚的商业应用场景。 但边缘侧AI计算将把AI从数据中心和云中的集中式服务器中解放出来,部署到制造工厂、手术室以及整个市政中心,实时处理数据,更接近物联网设备、传感器和智能系统。
4/9/2025 8:00:00 AM
Paula Rooney
AI图片泛滥怎么管?OpenAI计划给AI图像添加水印
随着生成式人工智能的高速发展,AI图像正以前所未有的速度在网络上传播。 从AI创作“宫崎骏风格”动画图,到仿真度极高的商品广告照、新闻配图,普通用户只需输入一句话,便可秒产专业级画面。 这种“视觉洪流”的背后,是OpenAI等技术巨头不断推陈出新的图像生成模型——其中最先进的,莫过于不久前发布的ChatGPT-4o内嵌的ImageGen。
4/9/2025 8:00:00 AM
CEO们认为AI可以比董事会成员制定更好的商业计划
一些AI专家并不像CEO那样,对这项技术能为他们的业务提供战略见解抱有信心,但其他人表示,AI正朝着这个方向迈进。 绝大多数CEO认为,AI已经发展得足够先进,可以开始接手C级高管和董事会成员所承担的一些职责。 在接受AI平台提供商Dataiku调查的CEO中,有94%的人认为,智能体可以提供与人类董事会成员相似或更好的商业决策建议。
4/9/2025 7:30:00 AM
Grant Gross
斯坦福2025 AI指数出炉!中美AI对决差距仅剩0.3%,DeepSeek领衔
就在刚刚,每年都备受瞩目的斯坦福AI指数报告,重磅发布了! 这份报告由斯坦福大学以人为本AI研究员发布,代表着每年AI领域最核心和前沿的动向总结。 今年,这份报告长达456页,抛出不少惊人观点。
4/9/2025 4:22:00 AM
新智元
Llama 4遭竞技场背刺!实锤用特供版刷榜,2000+对战记录公开
Llama 4真要被锤爆了,这次是大模型竞技场(Chatbot Arena)官方亲自下场开怼:竞技场上,Meta提供给他们的是特供版! 以下是竞技场背后lmarena.ai团队的原话:我们注意到社区对Llama-4最新版本在Arena平台的发布存在疑问。 为确保完全透明,现公开2000余组模型对战数据供公众审阅,包含用户提示词、模型回复及用户偏好数据(链接详见下一条推文)。
4/9/2025 3:33:00 AM
企业级模型推理部署工具vllm使用指南 - 部署最新deepseek-v3-0324模型
vLLM(Virtual Large Language Model)是由加州大学伯克利分校团队开发的高性能大模型推理框架,其核心特点围绕显存优化、高吞吐量、灵活性和易用性展开。 对比 ollama 作为个人开发者部署模型工具而言,vLLM 专注于高并发请求和大规模生产环境,适用于企业级应用和需要高效推理的场景。 vLLM 通过优化内存管理和并发处理,适合处理高负载的生产环境 。
4/9/2025 3:25:00 AM
PandaAI:一个基于AI的对话式数据分析工具
PandaAI 是一个基于 Python 开发的自然语言处理和数据分析工具,支持问答式(ChatGPT)的数据分析和报告生成功能。 PandaAI 提供了一个开源的框架,主要核心组件包含用于数据处理的数据准备层(Pandas)以及实现 Text2SQL 功能的自然语言接口。 数据源PandaAI 支持文件、数据库以及大数据平台等多种数据源连接,包括 Excel、CSV、MySQL、PostgreSQL、Oracle、Microsoft SQL Server、Databricks、Redshift、Snowflake、ClickHouse、Supabase、BigQuery、Salesforce 等。
4/9/2025 3:00:00 AM
模态编码器 | CLIP改进之SigLIP,采用sigmoid损失的图文预训练
DeepMind对CLIP改进的一篇工作--SigLIP,发表在2023CVPR。 简单看下研究动机:传统的对比学习方法如CLIP等依赖于 softmax 归一化,这需要一个全局视角来计算成对相似度,从而限制了批处理大小的扩展能力,并且在小批处理大小下表现不佳。 因此本文提出了一个简单的成对 Sigmoid 损失函数用于语言-图像预训练(SigLIP)。
4/9/2025 2:10:00 AM
Goldma
AI时代下数字化转型最大陷阱!是没数据,还是没用对数据?
许多企业谈起数字化转型,第一反应就是"我们没有数据基础"。 真相是,企业不缺数据,缺的是对数据价值的挖掘。 企业只要存续经营,就在不断产生大量数据,这些未被充分利用的数据就像沉睡的金矿,等待被唤醒创造价值...数据早已存在,只是未被唤醒企业数据无处不在。
4/9/2025 1:20:00 AM
大数据AI智能圈
大模型+数据分析:下一代智能查询优化体系的先行探索
当你每天面对万亿级数据、日均百万次查询请求时,你会怎么做? 处理海量数据查询犹如在迷雾中寻路,方向稍有不慎就会迷失。 数据负载高到屏幕只显示超时,查询速度慢到让你有时间泡一杯咖啡再来检查结果。
4/9/2025 1:00:00 AM
大数据AI智能圈
ChatGPT的危险之处:你永远不应该告诉AI机器人的五件事
但这个征服世界的大型语言模型聊天机器人被描述为一个“隐私黑洞”,人们担心它处理用户数据的方式,这甚至导致它在意大利被短暂封禁。 它的创造者OpenAI毫不掩饰这样一个事实:任何输入的数据都可能不安全。 这些数据不仅可能被用于进一步训练其模型,从而可能暴露给其他用户,而且还可能被人工审核,以检查其是否符合使用规则。
4/9/2025 12:13:00 AM
Bernard Marr
20万+围观GPT-4o整出Gif!我们玩出新高度
编辑 | Sia这届网友真是把 AI 玩出花! 继谷歌 Gemini 2.0 Flash 去水印骚操作后,Reddit 社区的老哥们又用 GPT-4o 解锁动画制作新姿势——直接生成动画关键帧。 只需简单指令,模型直接吐出连贯动作序列帧,丝滑程度堪比动画师原画。
4/8/2025 9:21:00 PM
AI好好用
谷歌 Gemini AI 升级文件分析功能,将支持 3GP、AVI、MP4 等八种视频格式
4 月 8 日消息,科技媒体 Android Authority 今天(4 月 8 日)发布博文,通过分析 APK 文件,发现谷歌 Gemini 即将升级文件分析功能,新增支持 3GP、AVI、FLV 等 8 种视频格式。 Gemini 现有文件分析功能支持文档、代码、表格等类型,但暂不支持视频处理。 该媒体分析 Google App 16.13.38 测试版代码,发现 Gemini 该功能将兼容 3GP、AVI、FLV、MOV、MP4 等主流视频格式。
4/8/2025 6:43:44 PM
故渊
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
MyShell ShellAgent 2.0发布:一句话创建App,零前端的AI革命来袭
AI视频记忆革命来了!Memories.ai获800万美元融资,挑战千万小时视频分析极限
因为不用AI写代码,我在终面挂了 | 一个程序员的奇葩面试经历
彻底解决出图困难!超高效的Kontext工作流搭建+提示词技巧
Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
Meta 被指控盗用 2000 余部成人影片训练 AI,或面临 3.5 亿美元天价赔偿
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
LLM
苹果
神经网络
Claude
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
具身智能
字节跳动
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
LLaMA