应用
百度再发力!李彦宏:未来5年 再为社会培养1000万AI人才
百度创始人李彦宏近日在一场发布会上宣布,未来五年,百度将继续加大力度,再为社会培养1000万名人工智能(AI)人才。 这一声明引起了广泛关注,标志着百度在推动 AI 人才发展方面的坚定决心。 据悉,百度在2020年曾提出一项目标,计划在五年内培养500万名 AI 人才,并于2024年提前完成了这一目标。
谷歌实验室推出新 AI 工具 Stitch:文字、图片可秒变 UI 设计与前端代码
谷歌实验室推出新AI工具Stitch,可将文字描述或图像快速转化为UI设计及前端代码,支持Figma无缝对接和代码导出,提升设计与开发效率。#谷歌AI# #UI设计工具#
星纪魅族预告新一代AI眼镜:支持眼动追踪与AI识脸,进军智能穿戴新战场
5月20日晚,星纪魅族官方发布预告视频,首次揭晓其下一代AI眼镜StarV的部分功能,展示了这款智能穿戴设备在AI视觉交互方面的进一步升级。 据预告内容,新一代StarV AI眼镜将支持眼球追踪、AI人脸识别、拍照与扫码支付等多项功能,表明其在感知交互、支付便利性和视觉AI处理能力上实现突破。 这些功能预示着设备将不仅是信息显示终端,更将成为具备主动感知与处理能力的智能助手。
英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识
英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。
谷歌开源 MedGemma AI 模型,医疗图像与文本分析神器
MedGemma 基于 Gemma 3 架构,提供 4B 参数的多模态模型(分类)和 27B 参数的纯文本模型两种配置,4B 模型擅长分类和解读医疗图像,可生成诊断报告或解答图像相关问题;27B 模型则擅长临床文本,支持患者分诊和决策辅助。
谷歌发布 Gemma 3n 端侧多模态模型,2GB 内存也能玩转 AI
今天召开的 2025 年 I/O 开发者大会上,谷歌推出了 Gemma 3n 端侧多模态 AI 模型,可以在手机、平板和笔记本电脑上本地运行,处理音频、文本、图片和视频多种数据类型。
腾讯大模型战略亮相 Turbo S 与 T1 模型全面升级
5月21日,腾讯宣布其混元大模型矩阵全面升级,标志着腾讯在人工智能领域的技术能力持续提升。 此次升级涵盖了多个方面,包括旗舰快思考模型混元TurboS、深度思考模型混元T1的升级,以及基于TurboS基座新推出的视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。 此外,腾讯还同步更新了混元图像2.0、混元3D v2.5及混元游戏视觉生成等一系列多模态模型。
飞书将上线AI产品“知识问答” 革新企业知识管理
近日,飞书宣布即将推出全新AI产品“知识问答”,以智能化手段重塑企业知识管理模式,助力企业数字化转型。 “知识问答”是一款深度融合人工智能技术的问答工具,能整合企业员工在飞书上有权限访问的各类信息,包括文档、消息记录等,员工在工作中遇到业务、技术等各类问题,都能快速获取精准答案,极大提升工作效率。 在实际测试场景中,其表现亮眼。
苹果将开放AI模型给开发者,力求催生创新应用
苹果公司近日宣布,将向第三方开发者开放其人工智能模型,旨在激发新应用的创造力,并提升其设备的吸引力。 知情人士透露,这一计划将在6月9日的全球开发者大会(WWDC)上正式发布。 苹果希望通过提供软件开发工具包(SDK)和相关框架,让开发者能够基于其大型语言模型构建 AI 功能。
腾讯混元宣布模型矩阵全面升级,新推视觉推理模型T1-Vision和语音通话模型混元Voice
今日,腾讯混元正式宣布其模型矩阵的全面升级,包括 旗舰快思考模型混元TurboS、深度思考模型混元T1升级,并基于TurboS基座,新推出视觉深度推理模型T1-Vision和端到端语音通话模型混元Voice。 另外,腾讯混元图像2.0、腾讯混元3D v2.5及混元游戏视觉生成等一系列多模态模型同步“上新”。 此次升级不仅增强了混元在 AI 领域的竞争力,也标志着腾讯在多模态技术上的新进展。
美图获阿里巴巴 2.5 亿美元投资,深度布局 AI 与电商领域
美图公司宣布与阿里巴巴签署了一项重大的战略投资协议,阿里巴巴将通过可转债形式向美图投资2.5亿美元。 这笔投资将为双方在电商平台、人工智能(AI)技术和云计算等多个领域的深度合作提供强大支持。 图源备注:图片由AI生成,图片授权服务商Midjourney根据协议,这项可转债的期限为三年,年利率为1%。
京东云宣布五大AI营销产品限时免费,助力商家提升销售效率
在最新的公告中,京东宣布将免费向其 POP 商家推出五大人工智能(AI)营销产品。 这一举措旨在帮助商家利用先进技术提升销售效果和运营效率。 这些新工具包括直播数字人、商家客服智能体、短视频生成工具、京点点以及京麦 AI 助手,均为商家提供了更为高效的营销手段。
Catena Labs获得1800万美元融资,打造AI原生金融机构
近日,人工智能初创公司 Catena Labs 在一份新闻稿中宣布,他们成功筹集了1800万美元的资金,旨在建设全球首个监管合规的 AI 原生金融机构,以支持 “代理经济” 的发展。 该公司由前 Circle 联合首席执行官肖恩・内维尔(Sean Neville)共同创办,他曾参与创建了 U SDC 稳定币。 本轮融资由知名风险投资公司 a16z Crypto 领投,参投方包括 Breyer Capital、Circle Ventures、Coinbase Ventures、CoinFund、Pillar VC、斯坦福工程风险基金等多个投资机构,以及包括 NFL 运动员汤姆・布雷迪、Twitch 联合创始人凯文・林和前 IBM 首席执行官山姆・帕尔米萨诺等知名天使投资人。
华硕CEO预测:AI电脑距离全面落地仍需两年
在台北举行的 Computex 展会上,华硕共同首席执行官胡镇荣(Samson Hu)表示,当前一波新型人工智能(AI)电脑的普及将需要到2026年甚至更久才能真正推动市场发展。 尽管去年的 AI 电脑发布引发了不少期待,但胡镇荣指出,市场前景并没有因此而显著改善,尤其是在当前全球经济形势不佳的背景下。 随着技术的不断进步,从华硕到联想等众多厂商都推出了 AI 电脑,希望能够为疲软的笔记本市场带来新的生机。
MarketWatch:谷歌加倍投入人工智能搜索,应对日益加剧的威胁
在近期举办的 I/O 开发者大会上,谷歌宣布将推出一系列新的人工智能(AI)功能,以巩固其在搜索引擎市场的领先地位。 随着 AI 技术的快速发展,尤其是来自 OpenAI 和 Perplexity 等新兴公司的竞争压力不断增大,谷歌似乎倍感压力。 因此,该公司推出了 “AI 模式”,这是其搜索引擎中 “最强大的 AI 搜索” 功能,具备更高级的推理和多模态能力。
字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破
字节跳动 发布了一款名为 BAGEL 的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。 BAGEL 在标准多模态理解基准测试中表现出色,超越了当前一些顶级开源视觉语言模型,如 Qwen2.5-VL 和 InternVL-2.5。 此外,在文本到图像的生成质量上,BAGEL 的表现也与强大的专业生成器 SD3相媲美。
谷歌NotebookLM视频概览重磅上线!PDF、图片秒变动画短片
谷歌在I/O2025大会上宣布,NotebookLM将推出全新视频概览(Video Overviews)功能,允许用户通过上传的PDF、图片、文本等来源素材,自动生成动画风格的短片,深入浅出地讲解复杂内容。 这一功能面向所有用户开放,首版仅支持英语,引发全球教育、科研和内容创作社区的热烈讨论。 AIbase综合最新社交媒体动态,深入解析视频概览的技术亮点及其对AI辅助学习与创作的深远影响。
谷歌推出 Project Astra,智能助理可控 Android 手机
谷歌近日正式发布了 Project Astra 的最新功能,该项目展示了其强大的智能助理能力,能够控制 Android 手机。 这一技术目前已经以应用程序的形式提供给受信任的测试者,并在 Pixel9Pro 上进行了演示。 在演示中,用户在修理自行车的过程中,与 Astra 进行实时对话。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉