AI在线 AI在线

AI

前端 x AI:基于Ollama、DeepSeek、Chroma、LangChain搭建AI应用开发框架

“纸上得来终觉浅,绝知此事要躬行”,因此学习的过程讲究“口到、手到、心到”,为避免浮于表面,需要通过实践进一步将理论内化为个人能力。 为了后续更好的在本地实践 AI 应用开发,今天我先带你在本地搭建基于 Ollama[1]、DeepSeek[2]、Chroma[3]、LangChain.js[4] 和 Next.js[5] 的全栈 AI 应用开发框架。 本开发框架秉承开源、轻量、易操作的理念,让你用最少的资源在本地进行 AI 应用开发实践,带你轻松踏入 AI 应用开发的大门。
5/22/2025 2:00:00 AM
赖祥燃

前端 x AI:从了解提示工程、RAG和微调开始

在AI工程应用中有三种应用范式,他们分别是提示工程(Prompt Engineering)、RAG(Retrieve Augmented Generation)、微调(Fine Tuning),那么在工程应用中我们该如何选择呢? 在具体介绍这三种范式之前,首先我们需要了解什么是大模型。 大模型通常指的是拥有大量参数和复杂结构的深度学习模型,它经过海量的多样化的数据预训练之后,具备了非常多的能力,包括编码、数学、金融、教育和法律等行业的能力。
5/22/2025 1:00:00 AM
赖祥燃

告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?

大模型浪潮下,你的 AI 应用遇到瓶颈了吗? 当 GPT、Claude、文心一言等各类强大模型如繁星般涌现,我们惊喜于它们令人惊叹的能力。 然而,在实际落地中,我们常常发现,即使是最顶尖的单一模型,也难以完美应对所有复杂场景的需求。
5/21/2025 4:27:00 PM
贝塔街的万事屋

英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界

近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。 随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。 物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。
5/21/2025 4:00:55 PM
AI在线

谷歌推出 MedGemma AI 模型:医疗图像与文本分析的革命性工具

在刚刚结束的2025年 I/O 开发者大会上,谷歌宣布开源全新医疗 AI 模型 ——MedGemma。 这款基于 Gemma3架构的模型专为医疗领域设计,具备强大的多模态图像和文本理解能力,旨在提升医疗诊断与治疗效率。 MedGemma 提供两种配置选项,分别为4B 和27B 参数模型。
5/21/2025 4:00:55 PM
AI在线

因违法违规收集使用个人信息 Kimi等多款AI应用软件被通报

根据国家网络与信息安全信息通报中心日前通报,经公安部计算机信息系统安全产品质量监督检验中心检测,在应用宝中35款移动应用存在违法违规收集使用个人信息情况。 其中包括《Kimi》《智谱清言》《AI智能秘书》《AI剪辑》等多款AI软件。 图源备注:图片由AI生成,图片授权服务商Midjourney35款被通报的应用具体情况如下:1、未以结构化清单的方式逐一列出收集、使用个人信息规则。
5/21/2025 4:00:55 PM
AI在线

面壁智能再获数亿元融资,推动AI技术落地汽车行业

5月21日,大模型创业公司面壁智能宣布成功完成新一轮融资,金额高达数亿元。 这轮融资由洪泰基金、国中资本、清控金信和茅台基金共同投资。 虽然面壁智能并未公开具体的融资额和估值,但公司表示,此次资金的注入将显著提升其大模型技术和产品壁垒,并加速在各行业的应用落地,尤其是在汽车领域。
5/21/2025 4:00:55 PM
AI在线

​百度再发力!李彦宏:未来5年 再为社会培养1000万AI人才

百度创始人李彦宏近日在一场发布会上宣布,未来五年,百度将继续加大力度,再为社会培养1000万名人工智能(AI)人才。 这一声明引起了广泛关注,标志着百度在推动 AI 人才发展方面的坚定决心。 据悉,百度在2020年曾提出一项目标,计划在五年内培养500万名 AI 人才,并于2024年提前完成了这一目标。
5/21/2025 4:00:29 PM
AI在线

星纪魅族预告新一代AI眼镜:支持眼动追踪与AI识脸,进军智能穿戴新战场

5月20日晚,星纪魅族官方发布预告视频,首次揭晓其下一代AI眼镜StarV的部分功能,展示了这款智能穿戴设备在AI视觉交互方面的进一步升级。 据预告内容,新一代StarV AI眼镜将支持眼球追踪、AI人脸识别、拍照与扫码支付等多项功能,表明其在感知交互、支付便利性和视觉AI处理能力上实现突破。 这些功能预示着设备将不仅是信息显示终端,更将成为具备主动感知与处理能力的智能助手。
5/21/2025 3:00:45 PM
AI在线

英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识

英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。
5/21/2025 2:53:40 PM
故渊

谷歌开源 MedGemma AI 模型,医疗图像与文本分析神器

MedGemma 基于 Gemma 3 架构,提供 4B 参数的多模态模型(分类)和 27B 参数的纯文本模型两种配置,4B 模型擅长分类和解读医疗图像,可生成诊断报告或解答图像相关问题;27B 模型则擅长临床文本,支持患者分诊和决策辅助。
5/21/2025 2:40:30 PM
故渊

谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI

今天召开的 2025 年 I/O 开发者大会上,谷歌推出了 Gemma 3n 端侧多模态 AI 模型,可以在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型。
5/21/2025 2:30:27 PM
故渊

DeepSeek-V3新论文:软硬协同,砸碎“算力神话”!

当AI大模型越来越“吃”硬件,把内存、算力、带宽逼到极限,追赶者们,或者说整个行业,除了干等硬件升级,还能怎么办? ChatGPT横空出世,大模型竞赛白热化。 英伟达的GPU成了硬通货,算力就是一切。
5/21/2025 2:01:22 PM

苹果将开放AI模型给开发者,力求催生创新应用

苹果公司近日宣布,将向第三方开发者开放其人工智能模型,旨在激发新应用的创造力,并提升其设备的吸引力。 知情人士透露,这一计划将在6月9日的全球开发者大会(WWDC)上正式发布。 苹果希望通过提供软件开发工具包(SDK)和相关框架,让开发者能够基于其大型语言模型构建 AI 功能。
5/21/2025 2:01:08 PM
AI在线

ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手

AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。 这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。 他表示,ChatGPT将从回答问题转变为为用户做事。
5/21/2025 1:57:58 PM

纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究

不再依赖语言,仅凭图像就能完成模型推理? 大模型又双叒叕迎来新SOTA! 当你和大模型一起玩超级玛丽时,复杂环境下你会根据画面在脑海里自动规划步骤,但LLMs还需要先转成文字攻略一格格按照指令移动,效率又低、信息也可能会丢失,那难道就没有一个可以跳过“语言中介”的方法吗?
5/21/2025 1:56:37 PM

瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊

京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊! 该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法。 它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%。
5/21/2025 1:54:20 PM

何恺明团队又发新作: MeanFlow单步图像生成SOTA,提升达50%

这段时间,大神何恺明真是接连不断地发布新研究。 这不,5 月 19 日,他又放出一篇新作! 论文标题:Mean Flows for One-step Generative Modeling 论文地址: MeanFlow 的单步生成建模框架,通过引入平均速度(average velocity)的概念来改进现有的流匹配方法,并在 ImageNet 256×256 数据集上取得了显著优于以往单步扩散 / 流模型的结果,FID 分数达到 3.43,且无需预训练、蒸馏或课程学习。
5/21/2025 1:53:49 PM